Настройка генерации речи

  1. Отмечайте ударения
  2. Разделяйте слова
  3. Меняйте написание слов
  4. Добавляйте паузы
  5. Используйте фонемы
  6. Полезные видео

Чтобы речь навыка звучала более естественно, оформите текст с применением TTS-разметки. Разметка размещается в свойстве response.tts:

{
  "response": {
    "text": "Добро пожаловать в Атлас.",
    "tts": "Добро пожаловать в +атлас.",
  }
}

Проверяйте разметку для голоса на тестовом стенде Speechkit. Так вы сразу услышите, как звучат изменения.

Отмечайте ударения

Если значение слова меняется в зависимости от ударения — добавляйте перед ударными гласными знак +. Например:

  • остр+ота
  • м+ука

Разделяйте слова

Разбейте сложные слова на части и проставьте ударения для каждой. Например:

  • мн+ого пр+офильный
  • с+еми пал+атинск

Меняйте написание слов

Попробуйте написать слова так, как они слышатся:

  • «ненастный»нен+асный
  • «пожалуйста»пож+алуста

Добавляйте паузы

Для дополнительной паузы используйте синтаксис sil <[ <количество_миллисекунд> ]>. Например, sil <[1000]> — это пауза длиной в 1 секунду.

{
  "response": {
    "text": "Смелость города берет.",
    "tts": "смелость sil <[500]> город+а берёт",
  }
}

Также паузу в 50–100 мс добавляет пробел между знаком препинания и следующим словом.

Используйте фонемы

Задавайте произношение слов с помощью фонем и синтаксиса слово <[произношение_по_фонемам]>. Например:

  • транскрипция <[t r a n s k rr ii p c y j schwa]>
Как использовать фонемы

Фонемы:

a aa b bb c ch d dd e ee f ff g gg h hh i ii j k kk l ll m mm n nn oo p pp r rr s sch schwa sh ss t tt u uu v vv y yy z zh zz pau

Использование:

  • aa, ee, ii, oo, uu — ударные гласные.
  • bb, dd, ff, gg, hh, kk, ll, mm, nn, pp, rr, ss, tt, vv, zz — мягкие согласные.
  • y — это «ы».
  • schwa — нейтральный гласный звук, в который могут превращаться безударные «а», «е», «и», «о», «ы».
  • pau — пауза при произнесении.

Полезные видео

Разработка прототипа голосового приложения
Как научить Алису петь?

Служба поддержки