Голосовую модель «Яндекса» научили узбекскому

«Яндекс» расширил языковую библиотеку программ распознавания и синтеза речи, добавив туда узбекский язык. Это расширит рынок использования ПО

Компания «Яндекс» анонсировала новую возможность в своём продукте Yandex SpeechKit — распознавание и синтез речи на узбекском языке. Это отличная новость для автоматизации колл-центров, анализа речи и разработки голосовых помощников.

Обучение модели проходило с использованием голоса настоящего диктора. Разработчики создали обширный набор данных, содержащий тысячи часов аудиозаписей и их расшифровки. Нейросеть не только способна синтезировать речь, но и воспроизводить звуковые особенности слов, что особенно полезно при произнесении сложных фамилий и заимствованных выражений.

Yandex SpeechKit учитывает особенности узбекского языка, включая произношение буквы «х». Григорий Атрепьев, директор по продуктам в YandexCloud, отмечает, что рынок речевых технологий в Узбекистане может достигать огромных масштабов, до 395 миллионов минут обработанной речи в год. Узбекский стал 16-м языком, с которым работает Yandex SpeechKit.

Источник: Ferra