Геометрія розбору сценарію: як театральні субтитри та титри виявляють діалог


Machine-translated article. If any wording differs, English text prevails.

Сучасні системи театральних субтитрів залежать від однієї критичної можливості: точного виявлення реплік зі сценаріїв.

Незалежно від того, чи генеруються титри для опери, субтитри для сценічних постановок або живі титри для забезпечення доступності, система повинна надійно визначати:

  • Хто говорить
  • Коли починається репліка
  • Де в сценарії з'являються блоки діалогу

На перший погляд, це звучить як проблема обробки природної мови. На практиці це не так. Під час розробки SurtitleLive v2 ми проаналізували майже 100 сценаріїв різними мовами та з різних театральних традицій. Цей процес привів нас до дивовижного висновку: Театральний сценарій – це не перш за все лінгвістичні дані. Це просторові дані.

1. Проблема західного сценарію: структура без пунктуації

Типовий англійський театральний сценарій покладається на умовні позначення макета, а не на пунктуацію для визначення ролей.

Приклад: Типовий макет сценічного сценарію

ГАМЛЕТ         Бути чи не бути: ось в чому питання.

ОФЕЛІЯ         Мій лорде, я маю спогади про вас.

Для людини-читача інтерпретація очевидна:

Блок Інтерпретація
ГАМЛЕТ Ім'я персонажа
Текст з відступом Діалог
ОФЕЛІЯ Ім'я персонажа

Але для парсера, який бачить лише звичайний текст, структура зникає. Ми розпізнаємо шаблони, тому що імена персонажів з'являються ВЕЛИКИМИ ЛІТЕРАМИ, діалог з відступом, а блоки розділені вертикальним інтервалом. Граматика західних сценаріїв типографічна, а не лінгвістична.

2. Від блоків сценарію до субтитрів

У середовищі живої вистави програмне забезпечення для субтитрів не просто відображає текст. Воно має перетворити сценарій на послідовність реплік субтитрів.

Кожен виявлений блок діалогу стає реплікою субтитрів, яку можна запустити під час живої вистави. Якщо парсер неправильно ідентифікує блок діалогу, система субтитрів запустить неправильну репліку – помилка, яка є неприйнятною в живому театрі.

3. Пунктуація проти макета: міжмовне відкриття

Виконання значно варіюється залежно від того, наскільки мова покладається на явні чи неявні маркери.

Китайська / Кантонська: на основі пунктуації

Китайські театральні сценарії часто кодують структуру явно:

張三:今天下雨。 (Чжан Сань: Сьогодні йде дощ.) 李四:真的嗎? (Лі Сі: Справді?) (他們望向窗外) ((Вони дивляться у вікно.))

Шаблон Класифікація
角色:台詞 (Персонаж: Діалог) Діалог
(...) (Дужки) Ремарка

Ця структура, керована пунктуацією, робить розбір майже тривіальним порівняно із західними форматами.

Порівняльна точність розбору (2026-03)

Мова / Формат Орієнтовна точність Ключовий структурний сигнал Вузьке місце розбору
Китайська / Кантонська ~100% Явна пунктуація (角色:台詞) Відсутнє
Японська ~98% Стабільні маркери цитування Незначні варіації форматування
Англійська (США/Великобританія) ~73% Неявна структура макета Відступ і використання великих літер
Німецька / Французька ~71% Складне театральне форматування Неоднозначні межі блоків

4. Прихована вартість перетворення сценаріїв на звичайний текст

Багато систем субтитрів обробляють сценарії, спочатку перетворюючи документи на звичайний текст, видаляючи інформацію про макет.

Оригінальний відформатований сценарій:

ГАМЛЕТ         Бути чи не бути

Після перетворення на звичайний текст: ГАМЛЕТ Бути чи не бути

Без відступу або меж блоків парсер повинен покладатися на семантичне вгадування, щоб визначити, чи є «ГАМЛЕТ» ім'ям персонажа, чи частиною речення.

5. Архітектурний поворот: Розбір на основі макета

Замість того, щоб запитувати «Що означає це речення?», машина запитує: «Як виглядає цей текстовий блок геометрично?»

Використовуючи вилучення OOXML з файлів .docx, ми отримуємо точні атрибути макета, такі як відступ (вимірюється в твіпах), прапорці використання великих літер і стилі абзаців.

Приклад: Сигнали макета, витягнуті зі сценарію

Блок A:

  • indent = 72pt, caps_ratio = 1.0, line_length = 8
  • → Класифіковано як Персонаж

Блок B:

  • indent = 36pt, caps_ratio = 0.2, line_length = 48
  • → Класифіковано як Діалог

6. Ремарки: Коли типографія стає структурою

У багатьох театральних сценаріях ремарки позначаються виключно типографікою – часто курсивом.

Приклад: Типографія як структура

ГАМЛЕТ         Бути чи не бути.

        Він робить паузу і дивиться на глядачів.

ОФЕЛІЯ         Мій лорде?

Блок Інтерпретація
ГАМЛЕТ Ім'я персонажа
Речення з відступом Діалог
Текст курсивом Ремарка

Після зникнення форматування парсер не може розрізнити діалог і розповідь. Деякі сценарії використовують ще більш мінімальні нотатки курсивом:

        пауза         відвертається

Вони майже не містять лінгвістичних підказок, покладаючись на 100% на атрибути типографічного стилю, такі як italic=true.

7. Трирівнева модель штучного інтелекту для надійного виявлення реплік

Ми перепозиціонували штучний інтелект як рецензента, а не як того, хто вгадує:

  • Рівень 1 — Детерміновані правила: Обробляє явні формати зі 100% точністю.
  • Рівень 2 — Перевірка ШІ: Діє як коректор для перевірки невизначених класифікацій.
    • Приклад: ГАМЛЕТ (тихо). Система визначає, чи є «(тихо)» ремаркою чи діалогом на основі контексту документа.
  • Рівень 3 — Класифікація ШІ: Повна класифікація для дуже неоднозначних регіонів, закріплена шаблонами макета, знайденими в іншому місці того самого документа.

Висновок

Театральні сценарії здаються простими, але їх значення випливає з просторової організації. Перейшовши від семантичного вгадування до розбору на основі макета, SurtitleLive надає правильну репліку субтитрів у потрібний момент.


FAQ

Q: Що таке репліка субтитрів у театрі? A: Репліка субтитрів – це момент, коли рядок діалогу має з’явитися на дисплеї субтитрів. Виявлення реплік вимагає ідентифікації блоків діалогу та переходів між мовцями в сценарії.

Q: Як система обробляє непослідовне форматування? A: Наша система кластеризує подібні макети. Якщо профіль документа змінюється, парсер виконує сегментацію макета, щоб адаптувати свою стратегію в режимі реального часу.

Q: Чому макет важливий під час розбору сценаріїв для субтитрів? A: Багато сценаріїв використовують відступ і пробіли замість пунктуації для кодування структури. Парсер, який спочатку враховує макет, виявляє репліки надійніше, ніж лише семантичні моделі.

Related Articles