Новая автоматическая модель распознавания Facebook работает с 51 языками

Исследователи компании Facebook представили модель, которая умеет распознавать слова на 51 языках. На подготовительных тестах инструмент показал рекордную точность, этот показатель будет улучшаться по мере обучения.

Исследователи Facebook представили крупнейшую модель автоматического определения речи (ASR). Она научилась осознавать 51 язык опосля того, как ее научили на 16 тыс. часов голосовых записей. В статье, размещенной на веб-сайте Arxiv.org, соавторы работы говорят, что система, которая содержит около млрд характеристик, увеличивает эффективность определения речи до 28,8%.

До этого чем загрузить материалы, ученые разделили 51 язык на отдельные группы, а потом избрали 10 тыс. единиц словаря в качестве набора инфы по каждой языковой группе. Опосля этого они вручную соединили некие маленькие языковые группы, пока их не осталось всего 6. Это в несколько раз ускорило процесс обучения модели.

«Как нам понятно, эта 1-ая работа, которая изучает многоязычные системы в массовом масштабе. Мы получили единую архитектуру определения речи для 51 языка, которая не просит огромного количества ресурсов», — отметили в Facebook.

Исследователи докладывают, что в процессе нескольких тестов более действенная версия их модели распознавала слова с эффективность в 28,75%. Этот показатель в несколько раз выше, чем у аналогов, и будет улучшаться по мере обучения.

В статье ученые также отметили, что скоро они опубликуют вторую версию системы. Она стала проще и добивается подходящих результатов всего за 10 минут. Ее научили на 53 тыс. часов «сырых» материалов.

Читайте также

— Выяснилось, что принудило цивилизацию майя покинуть свои городка

— Ученые раскрыли план герпеса по инфецированию человека: он похож на игру cо ставками

— На 3 денек работоспособности»>заболевания большая часть нездоровых COVID-19 теряют чутье и нередко мучаются насморком

Источник