Небольшой возврат к классике этого треда. Microsoft Research утверждают, что можно обучать LLMы с тритами (тернарными битами) вместо чисел с плавающей запятой, без потерь. Много интересных следствий, например то, что модели на 200+B будут влезать в один GPU. https://arxiv.org/abs/2402.17764 Ожидаю внешних проверок на следующей неделе. (кода как водится нет)
>>4076 Безупречная проекция, просто уморительно. Забавно даже, что я всё так угадал, когда ИИ реально был мусором и оставалось пространство для сомнений. Даже Stable diffusion никакого не существовало, я тогда vqgan-clip-ами игрался. Но логика ситуации лично мне была ясна. А вот вы, скотинки, действительно умрёте на холме, где не происходит и не может происходить ничего, кроме рыночного надувательства, сжимая в слабеющих лапках обнадёживающие новостные заметочки. Когда на заводах будут ебашить роботы, вы будете мусолить статейки о том, как робот наступил на ногу пролетарию Васе или уронил паллеты.
>>4077 > Вот как твой караван идёт к сингулярности, кста. Ты иск-то открывал? Или просто новость увидел?
> В реальности это несколько караванов, которые грызут друг друга за ноги из-за профита, О нет, только не профит!