Доброчанька
04/04/2023 (Tue) 22:08
No.3512
del
>>3496Собственно, самое интересное-то я и не сказал о современных Actor-Сritic системах. GPT-4 показала, что с монолитной моделью можно получить хорошие результаты, просто побуждая её критиковать саму себя, и это даёт качественно лучший файнтюн, чем то, что я показывал с LLMs can self-improve.
https://nanothoughts.substack.com/p/reflecting-on-reflexionhttps://evjang.com/2023/03/26/self-reflection.htmlhttps://newatlas.com/technology/gpt-4-reflexion/Скорее всего, эта способность будет доступна и другим моделям такого уровня.
Обрати внимание, она недоступна Кальсону, я ему указал на то, что он потерял категорию воображаемых индусов, но он лишь больше распетушился.