Приёмы в тексте: эмоции, паузы, акценты

Управление подачей голоса через структуру текста: эмоциональные теги Sonora V3, синтаксис пауз, обозначение ударений и логических акцентов, запись чисел и сложных слов. Все приёмы передаются модели через обычный текст без отдельных настроек.

~10 минут · Озвучка

Эмоциональные теги Sonora V3

Модель Sonora V3 распознаёт теги в квадратных скобках непосредственно в тексте. Тег указывается перед фрагментом, к которому относится, и определяет эмоциональную окраску, реакцию или громкость подачи.

Примеры использования

  • [грустно] Я не смог уснуть той ночью...
  • [взволнованно] Это невероятная новость!
  • [шепотом] Это секрет... [смеется] шучу!
  • [вздыхает] Опять понедельник...

Категории тегов

Категория Примеры Эффект
Эмоция [взволнованно], [нервно], [спокойно] Общая эмоциональная окраска фрагмента
Реакция [вздыхает], [смеется], [задыхается] Добавление естественных звуковых реакций
Когнитивная пауза [пауза], [колеблется], [заикается] Естественные остановки и задумчивость
Тональность [весело], [монотонно], [игриво] Характер подачи всего фрагмента
Громкость [КРИЧИТ], [шепотом], [тихо] Уровень громкости подачи

Многоголосые диалоги

Sonora V3 поддерживает разведение голосов в диалоге в рамках одного запроса. Реплики обозначаются метками, теги расставляются по необходимости:


Голос 1: [удивленно] Ты это серьезно?
Голос 2: [уверенно] Абсолютно! [пауза] Я все продумал.
Голос 1: [скептически] Хм... [вздыхает] Ладно, попробуем.

Паузы

Помимо тега [пауза] для Sonora V3 во всех моделях поддерживается синтаксис пауз заданной длительности.

Синтаксис

/X/ — где X указывает длительность паузы в секундах в диапазоне от 0.1 до 5.0.

  • Подождите /0.5/ я думаю. — пауза в 0.5 секунды между «Подождите» и «я думаю».
  • И победитель /2/ это вы! — пауза в 2 секунды для драматического эффекта.
  • Раз /0.5/ два /0.5/ три /1/ начали! — отсчёт с нарастающей паузой.

Рекомендуемые длительности

Тип паузы Длительность, сек Применение
Микропауза 0.1 – 0.3 Между словами в списке, после запятой
Короткая 0.3 – 0.7 Между предложениями, логическое разделение
Средняя 0.7 – 1.5 Между абзацами, смена темы
Длинная 1.5 – 3.0 Драматический эффект, важные моменты

Ударения и акценты

Ударение и логический акцент задаются регистром букв. Различаются два случая.

Ударный слог

Заглавная буква на ударном слоге помогает модели правильно произнести слово. Применяется для омографов и слов с частыми ошибками в ударении.

  • зАмок (строение) — замОк (устройство).
  • звонИт, тОрты, красИвее — корректные ударения в часто искажаемых словах.

Логический акцент

Слово, записанное полностью заглавными буквами, выделяется в предложении интонационно.

Это САМЫЙ важный момент в презентации.
Мы встретимся ЗАВТРА, а не сегодня.
НИКОГДА не делайте этого снова!

Произношение, числа, специальные символы

Разбивка по слогам

Для сложных терминов и заимствований запись с дефисами между слогами повышает чёткость произношения.

  • био-ин-фор-ма-ти-ка — пословное произношение.
  • кэш вместо cache, дедлайн вместо deadline — фонетическая запись англицизмов.

Числа, даты, телефоны

Большинство числовых записей раскрываются автоматически:

Запись в тексте Произношение
2024 год «две тысячи двадцать четвёртый год»
+7 (495) 123-45-67 «плюс семь четыреста девяносто пять...»
25% «двадцать пять процентов»
$100 «сто долларов»

Продвинутые техники

Комбинирование приёмов

Все приёмы поддерживают сочетание в одном тексте:

"ВНИМАНИЕ! /1/ Это очень важное сообщение. /0.5/
Пожалуйста, прослУшайте его до конца... /2/
Спасибо за внимание."

Контекст через прямую речь

Модель учитывает атрибуцию реплик в прямой речи. Описания типа «сказал он задумчиво» или «воскликнул он с восторгом» интерпретируются как указание интонации даже без специальных тегов.

  • «Вы уверены?» — спросил он с сомнением. — вопросительная интонация с оттенком неуверенности.
  • «Невероятно!» — воскликнул он с восторгом. — восклицательная радостная подача.
  • «Хм... интересно», — задумчиво произнёс он. — замедленная вдумчивая речь.

Темп через структуру текста

Темп речи определяется не только параметром «скорость», но и структурой самого текста.

  • Короткие предложения ускоряют темп.
  • Длинные сложноподчинённые конструкции замедляют речь и придают повествовательный характер.
  • Многоточие создаёт эффект задумчивости и замедления.