yandex

Text to speech (TTS) API

starstarstarstarstar

5/5

TTS Text-to-Speech — это передовая технология, преобразующая текст в убедительную и естественную речь. Благодаря передовым алгоритмам, она позволяет создавать звучащий контент с высоким качеством воспроизведения, делая текст доступным и понятным через голосовое взаимодействие.

ID для подключения по API : tts

Средняя скорость генерации ~ 6.70 сек
Дата выхода: 03/12/2025

Аудио

Озвучка текста

Средняя

Запустить через API

Выберите язык:

Как работать с Text to speech (TTS) через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

is_syncboolean

Выбор режима выполнения запроса: синхронно или асинхронно.

Значение по умолчанию : false

inputstring

Обязательно

Текст для генерации аудио.

Значение по умолчанию : An expressive oil painting of a basketball player of South Asian descent, dunking a basketball. The scene captures the player mid-dunk, framed against a backdrop that symbolizes the nebulae. The vigor and energy of the player's motion are metaphorically shown as an exploding nebula, galaxies and stars streaming off his figure

voicestring

Обязательно

Голос.

Значение по умолчанию : nova

response_formatstring

Формат сгенерированного аудио файла.

Значение по умолчанию : mp3

speednumeric

Скорость произношения.

Значение по умолчанию : 1