Как настроить генерацию речи

Текст, который навык отправляет Алисе, можно оформить в формате TTS (text-to-speech), чтобы тоньше управлять звуками, которые воспроизводит навык. Кроме произносимого текста вы можете использовать звуки из библиотеки Алисы.

  1. Настройка голосового синтеза
  2. Эффекты генерации голоса

Настройка голосового синтеза

(разметку для голоса можно проверить на тестовом стенде Speechkit)

Советы по использованию TTS-разметки:

  • При необходимости ударные гласные в словах следует отмечать знаком «+», например:

    • остр+ота,
    • м+ука.
  • Длинные слова можно разбить на слова покороче и проставить ударения для каждого из этих коротких слов, например:

    • мн+ого пр+офильный,
    • с+еми пал+атинск.
  • Некоторые слова можно попробовать писать так, как они слышатся:

    • «ненастный»нен+асный;
    • «пожалуйста»пож+алуста.
  • Каждый отделенный пробелами пунктуационный знак преобразуется в фонему pau (пауза в 50-100 мс). Таким образом в тексте можно задавать небольшие паузы последовательностью дефисов. Например: Смелость - - - - - - город+а берет.

    Не стоит создавать таким образом паузы больше 10 секунд — длинная последовательность pau-фонем может привести к звуковым артефактам при синтезе.

Эффекты генерации голоса

Вы можете наложить некоторые эффекты на голос, которым Алиса произносит ответ навыка. Примеры эффектов и формат указания эффектов — в разделе Наложение эффектов на голос.