Geometri Penguraian Naskah: Bagaimana Subtitle dan Supertitle Teater Mendeteksi Dialog


Machine-translated article. If any wording differs, English text prevails.

Sistem subtitle teater modern bergantung pada satu kemampuan penting: deteksi cue yang akurat dari naskah.

Baik menghasilkan supertitle untuk opera, subtitle untuk produksi panggung, atau teks langsung untuk aksesibilitas, sistem harus menentukan dengan andal:

  • Siapa yang berbicara
  • Kapan sebuah baris dimulai
  • Di mana blok dialog muncul dalam naskah

Sekilas, ini terdengar seperti masalah pemrosesan bahasa alami. Dalam praktiknya, tidak demikian. Selama pengembangan SurtitleLive v2, kami menganalisis hampir 100 naskah dari berbagai bahasa dan tradisi teater. Proses itu membawa kami pada kesimpulan yang mengejutkan: Naskah teater bukanlah data linguistik terutama. Ini adalah data spasial.

1. Masalah Naskah Barat: Struktur tanpa Tanda Baca

Naskah teater Inggris yang khas bergantung pada konvensi tata letak daripada tanda baca untuk menentukan peran.

Contoh: Tata letak naskah panggung yang khas

HAMLET         Menjadi, atau tidak menjadi: itulah pertanyaannya.

OPHELIA         Tuanku, aku punya kenangan tentangmu.

Bagi pembaca manusia, interpretasinya jelas:

Blok Interpretasi
HAMLET Nama karakter
Teks yang menjorok Dialog
OPHELIA Nama karakter

Tetapi untuk pengurai yang hanya melihat teks biasa, strukturnya menghilang. Kita mengenali polanya karena nama karakter muncul dalam SEMUA HURUF BESAR, dialog menjorok, dan blok dipisahkan oleh spasi vertikal. Tata bahasa naskah Barat bersifat tipografi, bukan linguistik.

2. Dari Blok Naskah ke Cue Subtitle

Dalam lingkungan pertunjukan langsung, perangkat lunak subtitle tidak hanya menampilkan teks. Ia harus mengubah naskah menjadi urutan cue subtitle.

Setiap blok dialog yang terdeteksi menjadi cue subtitle yang dapat dipicu selama pertunjukan langsung. Jika pengurai salah mengidentifikasi blok dialog, sistem subtitle akan memicu cue yang salah—kegagalan yang tidak dapat diterima di teater langsung.

3. Tanda Baca vs. Tata Letak: Penemuan Lintas Bahasa

Performa sangat bervariasi tergantung pada ketergantungan bahasa pada penanda eksplisit vs. implisit.

Cina / Kanton: Didorong oleh Tanda Baca

Naskah teater Cina sering kali menyandikan struktur secara eksplisit:

張三:今天下雨。 (Zhang San: Hari ini hujan.) 李四:真的嗎? (Li Si: Benarkah?) (他們望向窗外) ((Mereka melihat ke luar jendela.))

Pola Klasifikasi
角色:台詞 (Karakter: Dialog) Dialog
(...) (Tanda kurung) Arahan panggung

Struktur yang didorong oleh tanda baca ini membuat penguraian hampir trivial dibandingkan dengan format Barat.

Akurasi Penguraian Komparatif (2026-03)

Bahasa / Format Perkiraan Akurasi Sinyal Struktural Utama Hambatan Penguraian
Cina / Kanton ~100% Tanda baca eksplisit (角色:台詞) Tidak ada
Jepang ~98% Penanda kutipan yang stabil Variasi pemformatan kecil
Inggris (AS/Inggris) ~73% Struktur tata letak implisit Indentasi & kapitalisasi
Jerman / Prancis ~71% Pemformatan teater yang kompleks Batas blok yang ambigu

4. Biaya Tersembunyi Mengonversi Naskah ke Teks Biasa

Banyak sistem subtitle memproses naskah dengan terlebih dahulu mengonversi dokumen ke teks biasa, menghilangkan informasi tata letak.

Naskah berformat asli:

HAMLET         Menjadi atau tidak menjadi

Setelah konversi teks biasa: HAMLET Menjadi atau tidak menjadi

Tanpa indentasi atau batas blok, pengurai harus bergantung pada tebakan semantik untuk menentukan apakah "HAMLET" adalah nama karakter atau bagian dari kalimat.

5. Pivot Arsitektur: Penguraian Tata Letak-Pertama

Alih-alih bertanya "Apa arti kalimat ini?", mesin bertanya: "Seperti apa tampilan blok teks ini secara geometris?"

Dengan menggunakan ekstraksi OOXML dari file .docx, kami mengambil atribut tata letak yang tepat seperti indentasi (diukur dalam twips), bendera kapitalisasi, dan gaya paragraf.

Contoh: Sinyal tata letak diekstraksi dari naskah

Blok A:

  • indent = 72pt, caps_ratio = 1.0, line_length = 8
  • → Diklasifikasikan sebagai Karakter

Blok B:

  • indent = 36pt, caps_ratio = 0.2, line_length = 48
  • → Diklasifikasikan sebagai Dialog

6. Arahan Panggung: Ketika Tipografi Menjadi Struktur

Dalam banyak naskah teater, arahan panggung ditunjukkan murni melalui tipografi—seringkali huruf miring.

Contoh: Tipografi sebagai Struktur

HAMLET         Menjadi, atau tidak menjadi.

        Dia berhenti dan melihat ke arah penonton.

OPHELIA         Tuanku?

Blok Interpretasi
HAMLET Nama karakter
Kalimat yang menjorok Dialog
Teks miring Arahan panggung

Setelah pemformatan menghilang, pengurai tidak dapat membedakan antara dialog dan narasi. Beberapa naskah menggunakan catatan miring yang bahkan lebih minimal:

        jeda         berpaling

Ini hampir tidak mengandung cue linguistik, mengandalkan 100% pada atribut gaya tipografi seperti italic=true.

7. Model AI Tiga Tingkat untuk Deteksi Cue yang Andal

Kami memposisikan ulang AI sebagai peninjau daripada penebak:

  • Tingkat 1 — Aturan Deterministik: Menangani format eksplisit dengan akurasi 100%.
  • Tingkat 2 — Tinjauan AI: Bertindak sebagai proofreader untuk memvalidasi klasifikasi yang tidak pasti.
    • Contoh: HAMLET (dengan tenang). Sistem menentukan apakah "(dengan tenang)" adalah arahan panggung atau dialog berdasarkan konteks dokumen.
  • Tingkat 3 — Klasifikasi AI: Klasifikasi penuh untuk wilayah yang sangat ambigu, ditambatkan oleh pola tata letak yang ditemukan di tempat lain dalam dokumen yang sama.

Kesimpulan

Naskah teater tampak sederhana, tetapi maknanya muncul dari organisasi spasial. Dengan beralih dari tebakan semantik ke penguraian tata letak-pertama, SurtitleLive memberikan cue subtitle yang tepat, pada saat yang tepat.


FAQ

T: Apa itu cue subtitle dalam teater? J: Cue subtitle adalah saat ketika baris dialog harus muncul di tampilan subtitle. Deteksi cue membutuhkan identifikasi blok dialog dan transisi pembicara dalam naskah.

T: Bagaimana sistem menangani pemformatan yang tidak konsisten? J: Sistem kami mengelompokkan tata letak yang serupa. Jika profil dokumen berubah, pengurai melakukan Segmentasi Tata Letak untuk menyesuaikan strateginya secara real-time.

T: Mengapa tata letak penting saat mengurai naskah untuk subtitle? J: Banyak naskah menggunakan indentasi dan spasi alih-alih tanda baca untuk menyandikan struktur. Pengurai tata letak-pertama mendeteksi cue lebih andal daripada model semantik saja.

Related Articles