Доброчанька 12/09/2022 (Fri) 11:22 No.1258 del
(46.88 KB 769x740 FjeBMQpagAEjSZR.jpeg)
(155.90 KB 771x771 FjeBMQqaYAE_3pM.jpg)
>>1254
Всё я понял. Это справедливые замечания, хороший стенографист лучше whisper, потому что может модерировать дискуссию в непонятных ситуациях, и активно запраймиться на её контекст, и подгрузить себе специфичный лексикон, и использовать мультимодальные данные и вообще предугадывать следующие фразы. Круто. А Whisper может написать her son вместо Херсона, я не отрицаю.
Но тут как с шахматами. Многие гроссмейстеры предлагали свои гениальные эвристики, и пожалуй от них мог быть толк, но в итоге игры с полной информацией задавили MCST, а потом и тупым self-play, ибо это проще и дешевле. Когда парадигма whisper, то есть трансформера, кодирующего-декодирующего log-mel спектрограмму в общем случае, выйдет на плато (а пока не вышла, они ещё немного потренили и я вижу, что ошибок стало меньше) – либо прикрутят новые эвристики и каналы взаимодействия, либо всё это будет уже неактуально.

>>1255
Тащемта уже можно организовать
https://threadreaderapp.com/thread/1600890243452137472.html