yandex

Minimax Speech API

starstarstarstarstar

5/5

MiniMax Speech 2.6 Turbo — модель синтеза речи, создающая реалистичное аудио по текстовому описанию.

ID для подключения по API : minimax-speech

Средняя скорость генерации ~ 21.04 сек
Дата выхода: 03/12/2025

Аудио

Озвучка текста

Генерация

Для видео

Средняя

Запустить через API

Выберите язык:

Как работать с Minimax Speech через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

promptstring

Обязательно

Промпт.

Значение по умолчанию : Солнце клонится к закату, и тишина медленно наполняет пространство, будто сама природа затаила дыхание перед долгим сном.

modelstring

Режим нейросети.

Значение по умолчанию : HD

voice_idstring

Вид голоса.

Значение по умолчанию : Wise_Woman

speednumeric

Скорость.

Значение по умолчанию : 1.1

volnumeric

Громкость.

Значение по умолчанию : 1

pitchinteger

Тон.

Значение по умолчанию : 1

emotionstring

Эмоция.

Значение по умолчанию : sad

english_normalizationboolean

Нормализация английского.

Значение по умолчанию : true

sample_rateinteger

Частота дискретизации

Значение по умолчанию : 44100

bitrateinteger

Битрейт.

Значение по умолчанию : 128000

formatstring

Формат.

Значение по умолчанию : mp3

channelinteger

Количество каналов.

Значение по умолчанию : 2

language_booststring

Язык.

Значение по умолчанию : Russian

output_formatstring

Формат.

Значение по умолчанию : hex

pronunciation_tone_listarray

Словарь произношения.

enabledboolean

Нормализация громкости.

Значение по умолчанию : true

target_loudnessnumeric

Громкость.

Значение по умолчанию : -20

target_rangenumeric

Диапазон.

Значение по умолчанию : 10

target_peaknumeric

Пик.

Значение по умолчанию : -1