Приёмы в тексте: эмоции, паузы, акценты
Управление подачей голоса через структуру текста: эмоциональные теги Sonora V3, синтаксис пауз, обозначение ударений и логических акцентов, запись чисел и сложных слов. Все приёмы передаются модели через обычный текст без отдельных настроек.
Эмоциональные теги Sonora V3
Модель Sonora V3 распознаёт теги в квадратных скобках непосредственно в тексте. Тег указывается перед фрагментом, к которому относится, и определяет эмоциональную окраску, реакцию или громкость подачи.
Примеры использования
[грустно] Я не смог уснуть той ночью...[взволнованно] Это невероятная новость![шепотом] Это секрет... [смеется] шучу![вздыхает] Опять понедельник...
Категории тегов
| Категория | Примеры | Эффект |
|---|---|---|
| Эмоция | [взволнованно], [нервно], [спокойно] |
Общая эмоциональная окраска фрагмента |
| Реакция | [вздыхает], [смеется], [задыхается] |
Добавление естественных звуковых реакций |
| Когнитивная пауза | [пауза], [колеблется], [заикается] |
Естественные остановки и задумчивость |
| Тональность | [весело], [монотонно], [игриво] |
Характер подачи всего фрагмента |
| Громкость | [КРИЧИТ], [шепотом], [тихо] |
Уровень громкости подачи |
Многоголосые диалоги
Sonora V3 поддерживает разведение голосов в диалоге в рамках одного запроса. Реплики обозначаются метками, теги расставляются по необходимости:
Голос 1: [удивленно] Ты это серьезно?
Голос 2: [уверенно] Абсолютно! [пауза] Я все продумал.
Голос 1: [скептически] Хм... [вздыхает] Ладно, попробуем.
Паузы
Помимо тега [пауза] для Sonora V3 во всех моделях
поддерживается синтаксис пауз заданной длительности.
Синтаксис
/X/ — где X указывает длительность паузы в секундах в
диапазоне от 0.1 до 5.0.
Подождите /0.5/ я думаю.— пауза в 0.5 секунды между «Подождите» и «я думаю».И победитель /2/ это вы!— пауза в 2 секунды для драматического эффекта.Раз /0.5/ два /0.5/ три /1/ начали!— отсчёт с нарастающей паузой.
Рекомендуемые длительности
| Тип паузы | Длительность, сек | Применение |
|---|---|---|
| Микропауза | 0.1 – 0.3 | Между словами в списке, после запятой |
| Короткая | 0.3 – 0.7 | Между предложениями, логическое разделение |
| Средняя | 0.7 – 1.5 | Между абзацами, смена темы |
| Длинная | 1.5 – 3.0 | Драматический эффект, важные моменты |
Ударения и акценты
Ударение и логический акцент задаются регистром букв. Различаются два случая.
Ударный слог
Заглавная буква на ударном слоге помогает модели правильно произнести слово. Применяется для омографов и слов с частыми ошибками в ударении.
зАмок(строение) —замОк(устройство).звонИт,тОрты,красИвее— корректные ударения в часто искажаемых словах.
Логический акцент
Слово, записанное полностью заглавными буквами, выделяется в предложении интонационно.
Это САМЫЙ важный момент в презентации.
Мы встретимся ЗАВТРА, а не сегодня.
НИКОГДА не делайте этого снова!
Произношение, числа, специальные символы
Разбивка по слогам
Для сложных терминов и заимствований запись с дефисами между слогами повышает чёткость произношения.
био-ин-фор-ма-ти-ка— пословное произношение.кэшвместоcache,дедлайнвместоdeadline— фонетическая запись англицизмов.
Числа, даты, телефоны
Большинство числовых записей раскрываются автоматически:
| Запись в тексте | Произношение |
|---|---|
2024 год |
«две тысячи двадцать четвёртый год» |
+7 (495) 123-45-67 |
«плюс семь четыреста девяносто пять...» |
25% |
«двадцать пять процентов» |
$100 |
«сто долларов» |
Продвинутые техники
Комбинирование приёмов
Все приёмы поддерживают сочетание в одном тексте:
"ВНИМАНИЕ! /1/ Это очень важное сообщение. /0.5/
Пожалуйста, прослУшайте его до конца... /2/
Спасибо за внимание."
Контекст через прямую речь
Модель учитывает атрибуцию реплик в прямой речи. Описания типа «сказал он задумчиво» или «воскликнул он с восторгом» интерпретируются как указание интонации даже без специальных тегов.
«Вы уверены?» — спросил он с сомнением.— вопросительная интонация с оттенком неуверенности.«Невероятно!» — воскликнул он с восторгом.— восклицательная радостная подача.«Хм... интересно», — задумчиво произнёс он.— замедленная вдумчивая речь.
Темп через структуру текста
Темп речи определяется не только параметром «скорость», но и структурой самого текста.
- Короткие предложения ускоряют темп.
- Длинные сложноподчинённые конструкции замедляют речь и придают повествовательный характер.
- Многоточие создаёт эффект задумчивости и замедления.