yandex

Chatterbox Speech-to-Speech API

starstarstarstarstar

5/5

Chatterbox Speech-to-Speech — это нейросеть для замены голоса в аудиозаписи с сохранением исходной интонации и ритма речи. Она идеально подходит для быстрого преобразования голоса без потери эмоциональной окраски или необходимости перезаписи.

ID для подключения по API : chatterbox-speech

Средняя скорость генерации ~ 2.56 сек
Дата выхода: 03/12/2025

Аудио

Переозвучка текста

Средняя

Запустить через API
SoTA

Выберите язык:

Как работать с Chatterbox Speech-to-Speech через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

source_audio_urlurl_or_file

Обязательно

Входной аудио файл.

target_voice_audio_urlurl_or_file

Входной аудио файл.