yandex

Minimax Speech 2.8 API

starstarstarstarstar

5/5

MiniMax Speech 2.8 Turbo — модель синтеза речи, создающая реалистичное аудио по текстовому описанию.

ID для подключения по API : minimax-speech-2-8

Средняя скорость генерации ~ 26.20 сек
Дата выхода: 18/02/2026

Аудио

Озвучка текста

Генерация

Для видео

Средняя

Запустить через API

Выберите язык:

Как работать с Minimax Speech 2.8 через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

promptstring

Обязательно

Промпт.

Значение по умолчанию : В мире, где стираются границы реальности, остался только один ориентир — твой внутренний свет. Следуй за ним сквозь тьму неизведанных земель, и ты обретешь то, что давно потерял.

modelstring

Режим нейросети.

Значение по умолчанию : HD

voice_idstring

Вид голоса.

Значение по умолчанию : Patient_Man

speednumeric

Скорость.

Значение по умолчанию : 1.1

volnumeric

Громкость.

Значение по умолчанию : 1

pitchinteger

Тон.

Значение по умолчанию : 1

emotionstring

Эмоция.

english_normalizationboolean

Нормализация английского.

Значение по умолчанию : true

sample_rateinteger

Частота дискретизации

Значение по умолчанию : 44100

bitrateinteger

Битрейт.

Значение по умолчанию : 128000

formatstring

Формат.

Значение по умолчанию : mp3

channelinteger

Количество каналов.

Значение по умолчанию : 2

language_booststring

Язык.

Значение по умолчанию : Russian

output_formatstring

Формат.

Значение по умолчанию : url

pronunciation_tone_listarray

Словарь произношения.

enabledboolean

Нормализация громкости.

Значение по умолчанию : true

target_loudnessnumeric

Громкость.

Значение по умолчанию : -20

target_rangenumeric

Диапазон.

Значение по умолчанию : 10

target_peaknumeric

Пик.

Значение по умолчанию : -1

pitch_modifyinteger

Высота тона в полутонах.

Значение по умолчанию : 0

intensityinteger

Интенсивность голоса.

Значение по умолчанию : 0

timbreinteger

Тембр голоса.

Значение по умолчанию : 0