Skip to content

Translate: \s and \p markers reversed when section heading occurs mid-verse #708

@mmartin9684-sil

Description

@mmartin9684-sil

If the source verse contains a section heading mid-verse, followed by a paragraph marker and the remainder of the verse, the draft translation reverses the section heading segment and the paragraph marker segment.

GEN 2:4 (YakNbt_2025_04_01):

\v 4 यसरी यहवे प्रभु परमेश्‍वरले आकाश र पृथ्‍वी बनाउनुभयो।
\s अदनमा भएको बगैंचा
\p यहवे प्रभु परमेश्‍वरले पृथ्‍वी र आकाश बनाउनुभएको समयमा,
\v 5 पृथ्‍वीमा एउटै पनि रूखको बोट उम्रेको थिएन अनि केही पनि उम्रिएको थिएन। किनभने त्‍यतिबेला सम्‍म उहाँले पानी बर्साउनुभएको थिएन, अनि खनजोत गर्ने मानिस पनि थिएनन्।

Verse draft (note the section heading segment and paragraph segment are reversed):

\v 4 इटजाट्‍न परमप्रभु परमेश्‍वरै सर्‌घा र पृथ्‍वीकी सृष्‍टि जाटा। 
\p परमप्रभु परमेश्‍वरै पृथ्‍वी र सर्‌घाकी खास्‍च बेलाङ,
\s अदनामाङ लेच बगैँचा
\v 5 होडीक बेला भुमीयाङ हीर वनस्‍पति मागीट्‍नन्‍या। हीजैडेनाङ परमप्रभु परमेश्‍वरै पृथ्‍वीयाङ इडीक बेलासम्‍म नामास माराहाक्‍न्‍या र भुमीयाङ कोखी र घोयोखी भर्मी मालेया।

Experiment folders demonstrating this issue:

  • Nepal > EMagar > NLLB.1.3B.npi-SNHB+YakNbt.mgp-EMagar.2025_04_01
  • Nepal > METharu > NLLB.1.3B.npi-NNRV+YakNbt.thq-METharu.2025_04_01

Metadata

Metadata

Assignees

Labels

pipeline 6: inferIssue related to using a trained model to translate.

Type

Projects

Status

✅ Done

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions