Сбер выпустил на Windows и Mac ИИ-программу для перевода голоса в текст и обратно

Компания Сбер представила приложение SaluteSpeech App для операционных систем Windows и macOS.

Новинка, доступная в бета-версии, позволяет пользователям, даже без навыков программирования, с легкостью синтезировать и распознавать речь, а также генерировать текст.

Приложение SaluteSpeech App предлагает разнообразные функции, включая распознавание речи из аудиофайлов разных форматов, таких как PCM, OPUS, MP3, FLAC, ALAW и MULAW.

Пользователи могут также синтезировать речь, выбирая из различных голосов и настраивая ударение, акцент и интонацию с помощью SSML-тегов. Кроме того, приложение позволяет генерировать тексты, используя токен GigaChat API.

Для работы с приложением необходимо получить токен SaluteSpeech API для синтеза и речевого распознавания или токен GigaChat API для генерации текста.

Отметим, что свежий релиз Сбера открывает новые возможности для удобного и эффективного взаимодействия с голосовыми данными, делая технологии распознавания и синтеза речи доступными ещё более широкому кругу пользователей.

Источник: Ferra