Meta AI + Google AI cоздают единую модель понимания всей человеческой речи
В 2021 это уже не фантастика, а чисто инженерная задача
Под дымовую завесу пустопорожней полемики о реализуемости сильного ИИ (AGI), БигТех проявляет бульдожью хватку при решении самых востребованных для бизнеса задач. И пока ширнармассы всюду где попало щеголяют знанием в реальности уже устаревшего термина «Большие Данные», БигТех уже сделал ставку на понятие нового поколения — «Большие Модели».
В новой системе самостоятельного обучения речи на 128 языках используется очень большая модель. XLS-R — это нейронная сеть для распознавания речи, определения языка и перевода. Она использует 2 млрд параметров и почти полумиллиона часов общедоступной речевой аудиозаписи на 128 языках, что почти в 10 раз больше, чем в предыдущей системе Facebook, созданной в прошлом году. Результат уже впечатляет — снижение уровеня ошибок в среднем на 14–34%.
Бизнес цель планируемого прорыва двойная:
✔️ Окончательное решение вопроса синхронного перевода человеческой речи, с помощью мобильных гаджетов (мечта фантастов 20го века)
✔️ Голосовое общение человеко-машинных сущностей в виртуальных средах Метавселенной (на что фантастам не хватило фантазии, а вот БигТеху хватило)
________________________
Ваши шансы увидеть мои новые посты быстро уменьшатся до нуля, если вы не лайкаете, не комментируете и не делитесь в соцсетях.