Доброчанька
12/09/2022 (Fri) 11:22
No.1258
del
>>1254Всё я понял. Это справедливые замечания, хороший стенографист лучше whisper, потому что может модерировать дискуссию в непонятных ситуациях, и активно запраймиться на её контекст, и подгрузить себе специфичный лексикон, и использовать мультимодальные данные и вообще предугадывать следующие фразы. Круто. А Whisper может написать her son вместо Херсона, я не отрицаю.
Но тут как с шахматами. Многие гроссмейстеры предлагали свои гениальные эвристики, и пожалуй от них мог быть толк, но в итоге игры с полной информацией задавили MCST, а потом и тупым self-play, ибо это проще и дешевле. Когда парадигма whisper, то есть трансформера, кодирующего-декодирующего log-mel спектрограмму в общем случае, выйдет на плато (а пока не вышла, они ещё немного потренили и я вижу, что ошибок стало меньше) – либо прикрутят новые эвристики и каналы взаимодействия, либо всё это будет уже неактуально.
>>1255Тащемта уже можно организовать
https://threadreaderapp.com/thread/1600890243452137472.html