ИИ Facebook может определять до пяти разных голосов в одном разговоре

Инженеры Facebook представили новейшую модель, которая может найти до 5 различных голосов, потом перевести их в текст либо поделить на различные дорожки.

Искусственный ум (ИИ) компании Facebook обучили определять до 5 различных голосов в одном разговоре, переводить их в текст либо поделить на 5 различных дорожек. Команда утверждает, что новейший способ превосходит все аналоги по качеству и быстроте разделения источников речи, угнетению шума и реверберации.

Facebook употребляла новейшую рекуррентную нейронную сеть для сотворения новейшего класса алгоритмов, использующих внутреннее состояние, схожее на память, для обработки последовательностей входов переменных. При всем этом модель может автоматом найти говорящих и избрать речевую модель.

У юзеров из различных государств в приложениях на iOS произошёл массовый сбой

Разделение речи является важным шагом на пути к улучшению коммуникации в разных приложениях — с помощью голосовых сообщений либо потокового аудио. Не считая того, способы разделения речи, предложенные исследователями, можно применить для угнетения фонового шума, к примеру, при записи музыкальных инструментов.

Ранее исследователи компании Facebook представили модель, которая умеет распознавать слова на 51 языках. На подготовительных тестах инструмент показал рекордную точность, этот показатель будет улучшаться по мере обучения. Система, которая содержит около млрд характеристик, увеличивает эффективность определения речи до 28,8%.

Читать также:

Комета NEOWISE видна в Рф. Где ее узреть, куда глядеть и как создать фото

Выяснилось, что принудило цивилизацию майя покинуть свои городка

На 3 денек Источник