JAICP

Использование SSML-тегов


С помощью тегов Speech Synthesis Markup Language (SSML, язык разметки синтеза речи) вы можете контролировать, как Aimyvoice будет синтезировать речь из переданного текста.

Используйте SSML-теги в параметре text в теле POST-запроса. Их также можно указать в тексте тестовой фразы на странице Управление и на странице голоса в каталоге.

Поддерживаемые теги

Функция Тег
Добавляет паузу <break>
Определяет фразовое ударение <emphasis>
Добавляет паузу между абзацами <p>
Задает громкость и темп речи <prosody>
Задает правила озвучивания текста <say-as>
Добавляет паузу между предложениями <s>
Заменяет звучание слова на другое <sub>

break

Добавляет паузу в текст. Длительность паузы укажите в атрибуте time (в секундах или миллисекундах). Максимальная длительность — 5 секунд.

Мой дядя <break time="1s"/> самых честных правил <break time="1s"/> Когда не в шутку занемог<break time="1s"/> Он уважать себя заставил.

emphasis

Определяет место фразового ударения в предложении.

<emphasis>Ты</emphasis> не пройдёшь

В настоящее время использование этого тега тестируется. В некоторых случаях фразовое ударение может быть слабовыраженным или вообще не прозвучать.

Чтобы обозначить фразовое ударение в тексте, вы также можете использовать # перед нужным словом.

p

Добавляет паузу по длительности равную паузе между абзацами. Пауза после абзаца длиннее, чем пауза после точки.

<p>В тёмно-синем лесу</p> <p>Где трепещут осины</p> <p>Где с дубов-колдунов</p> <p>Облетает листва</p>

prosody

Управляет громкостью и темпом речи.

Атрибут Описание
volume Задает громкость. Указывается в процентах, в диапазоне 50–200.
rate Задает темп. Указывается в процентах, в диапазоне 50–200.

Тег может работать нестабильно, если вы зададите крайние значения для атрибутов.

<prosody volume="150">Голос будет звучать громче.</prosody>
<prosody rate="150">Речь будет произноситься быстрее.</prosody>
<prosody rate="75">Речь будет произноситься медленнее.</prosody>

say-as

Задает правила озвучивания текста.

Атрибут Описание
stress Указывает порядковый номер ударной гласной в слове.
Чтобы обозначить ударение в слове, при передаче текста вы также можете использовать + после ударной гласной.
interpret-as Задает формат прочтения слова.

Возможные значения:

• date — чтение числа как даты. Также можно указать формат даты с помощью атрибута format.

• telephone — чтение числа как номера телефона.
Например, <say-as interpret-as="telephone">89123456789</say-as> будет озвучено как «восемь девятьсот двенадцать триста сорок пять шестьдесят семь восемьдесят девять», а <say-as interpret-as="telephone">44-55-66</say-as> как «сорок четыре пятьдесят пять шестьдесят шесть».

• characters — чтение текста по символам. Поддерживается только кириллица.
Например, <say-as interpret-as="characters">МГУ</say-as> будет озвучено как «эм гэ у».

• cardinal — чтение числа как количественного числительного.
Например, <say-as interpret-as="cardinal">21</say-as> будет озвучено как «двадцать один».

• ordinal — чтение числа как порядкового числительного.
Например, <say-as interpret-as="ordinal">21</say-as> будет озвучено как «двадцать первый».
format Определяет формат даты. Нужно указывать, если для атрибута interpret-as вы указали значение date.

Возможные значения:
• dmy — день, месяц, год;
• mdy — месяц, день, год;
• ymd — год, месяц день;
• dm —день, месяц;
• md — месяц, день;
• ym — год, месяц;
• my — месяц, год;
• d — день;
• m — месяц;
• y — год.

Например, <say-as interpret-as="date" format="dmy">22041870</say-as> будет озвучено как «двадцать второе апреля тысяча восемьсот семидесятого года».
<say-as stress="5">дезоксирибоза</say-as>
<say-as interpret-as="date" format="ydm">20212102</say-as>
<say-as interpret-as="date" format="md">6.11</say-as>
<say-as interpret-as="telephone">89123456789</say-as>
<say-as interpret-as="telephone">20-21-22</say-as>
<say-as interpret-as="characters">РЛС</say-as>
<say-as interpret-as="cardinal">42</say-as>
<say-as interpret-as="ordinal">42</say-as>

s

Добавляет паузу по длительности равную паузе после точки. Пауза после точки короче, чем пауза после абзаца.

<s>Нет я не плачу</s> <s>И не рыдаю</s>

sub

Заменяет звучание слова на другое. Например, вы можете использовать этот тег, чтобы передать более привычное звучание («что» — «што») или правильное произнесение единицы измерения («м/c» — «метров в секунду»). Укажите желаемое звучание в атрибуте alias.

Дни и ночи у <sub alias= "мартэновских">мартеновских</sub> печей