Доброчанька 01/22/2023 (Sun) 16:35 No.2954 del
Материалы и мыслишки.

1) Неотцензуренная GPT судя по намёкам может чуть больше и интереснее. Но насколько? "Тупость" ChatGPT от "RLHF фазы"?

2) https://habr.com/ru/post/709472/
https://www.lesswrong.com/posts/uHyZmfZKpXxo6uiEe/ai-psychology-should-ground-the-theories-of-ai-consciousness
https://www.lesswrong.com/posts/yGaw4NqRha8hgx5ny/the-case-for-becoming-a-black-box-investigator-of-language
https://www.lesswrong.com/posts/LbrPTJ4fmABEdEnLf/200-concrete-open-problems-in-mechanistic-interpretability
https://www.lesswrong.com/posts/ddR8dExcEFJKJtWvR/how-evolutionary-lineages-of-llms-can-plan-their-own-future
https://www.lesswrong.com/posts/oSPhmfnMGgGrpe7ib/properties-of-current-ais-and-some-predictions-of-the
https://www.lesswrong.com/posts/yRAo2KEGWenKYZG9K/discovering-language-model-behaviors-with-model-written
https://www.lesswrong.com/posts/vJFdjigzmcXMhNTsx/simulators
https://www.lesswrong.com/posts/yRAo2KEGWenKYZG9K/discovering-language-model-behaviors-with-model-written
https://www.lesswrong.com/posts/rxoBY9CMkqDsHt25t/eliciting-latent-knowledge-elk-distillation-summary

Статья от "ИИ-психолога" лессвронговца. Там больше интересен типичный спор "это всего лишь программа и математика" в комментариях, в котором он внезапно демонстрирует "жидошизовую" позицию: "да вы человеки такие же".

Message too long. Click here to view full text.