Meta AI + Google AI cоздают единую модель понимания всей человеческой речи

В 2021 это уже не фантастика, а чисто инженерная задача

Сергей Карелов
1 min readNov 23, 2021

Под дымовую завесу пустопорожней полемики о реализуемости сильного ИИ (AGI), БигТех проявляет бульдожью хватку при решении самых востребованных для бизнеса задач. И пока ширнармассы всюду где попало щеголяют знанием в реальности уже устаревшего термина «Большие Данные», БигТех уже сделал ставку на понятие нового поколения — «Большие Модели».

В новой системе самостоятельного обучения речи на 128 языках используется очень большая модель. XLS-R — это нейронная сеть для распознавания речи, определения языка и перевода. Она использует 2 млрд параметров и почти полумиллиона часов общедоступной речевой аудиозаписи на 128 языках, что почти в 10 раз больше, чем в предыдущей системе Facebook, созданной в прошлом году. Результат уже впечатляет — снижение уровеня ошибок в среднем на 14–34%.

Бизнес цель планируемого прорыва двойная:

✔️ Окончательное решение вопроса синхронного перевода человеческой речи, с помощью мобильных гаджетов (мечта фантастов 20го века)

✔️ Голосовое общение человеко-машинных сущностей в виртуальных средах Метавселенной (на что фантастам не хватило фантазии, а вот БигТеху хватило)

Объявление

Подробное описание

________________________

Ваши шансы увидеть мои новые посты быстро уменьшатся до нуля, если вы не лайкаете, не комментируете и не делитесь в соцсетях.

--

--

Сергей Карелов
Сергей Карелов

Written by Сергей Карелов

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации

No responses yet