Chapter 12. Праца з фарматаваным тэкстам

1. Тэгі фарматаваньня
2. Апэрацыі з тэгамі
3. Укладаньне групаў тэгаў
4. Перакрыцьцё групаў тэгаў
5. Магчымасьці праверкі тэгаў
6. Праверка групаў тэгаў
7. Парады наконт кіраваньня тэгамі

Інфармацыю пра фарматаваньне ў зыходным файле звычайна трэба аднаўляць у файле зь перакладам. OmegaT адлюстроўвае фарматаваньне ў тэксьце падтрыманых фарматаў (у прыватнасьці DocBook, HTML, XHTML, Open Document Format [ODF] і Office Open XML [MS Office 2007 і пазьнейшых вэрсіяў]) у выглядзе тэгаў. Звычайна тэгі ігнаруюцца пры разглядзе падабенства паміж рознымі тэкстамі для мэтаў супастаўленьне. Тэгі, адноўленыя ў перакладзеным сэгмэньце, будуць прысутнічаць у перакладзеным дакумэньце.

1. Тэгі фарматаваньня

Іменаваньне тэгаў

Тэгі складаюцца з аднаго-трох сымбаляў і нумара. Унікальны нумар дазваляе групаваць тэгі, якія адпавядаюць адзін аднаму, і адрозьніваць тэгі, якія маюць аднолькавы сымбаль-скарот, але зьяўляюцца насамрэч рознымі. Спалучэньні сымбаляў, якія выкарыстоўваюцца, прызначаныя, каб паказваць схаваны сэнс тэга (напрыклад b [bold] для паўтлустага шрыфту, i [italics] для курсіва і г. д.)

Нумарацыя тэгаў:

Тэгі нумаруюцца з пасьлядоўным павелічэньнем па групе тэгаў. “Групы тэгаў” у гэтым кантэксьце — гэта адзін тэг (напрыклад, <i0> і </i0>). У адным сэгмэньце першая група (парны або адзіночны тэг) атрымлівае нумар 0, другая — нумар 1 і г. д. У першым прыкладзе, гл. ніжэй, ёсьць 3 групы тэгаў (пара, адзінкавы, далей яшчэ адна пара), у другім прыкладзе — толькі адна група (пара).

Пары і адзіночныя:

Тэгі заўжды або адзіночныя, або парныя. Адзіночныя тэгі прадстаўляюць інфармацыю пра фарматаваньне, якое не кранае навакольны тэкст (множныя прабельныя сымбалі або разрыў радка, напрыклад).

<b0><Ctr+N></b0>, <br1><b2><Enter></b2><сэгмэнт 2132>

<br1> — гэта адзіночны тэг, які не кранае навакольны тэкст. Парныя тэгі звычайна пазначаюць інфармацыю, датычную тэкста паміж адчыняльным і зачыняльным тэгам пары. <b0> і </b0> ніжэй — парныя, яны ўплываюць на тэкст log.txt. Памятайце, што адчыняльны тэг заўсёды павінны быць перад адпаведным зачыняльным тэгам:

<Файл часопіса (<b0>log.txt</b0>) для апэрацыяў маніторынга і памылак.<сэгмэнт 3167>

У OmegaT тэгі ствараюцца перад апрацоўкай для сэгмэнтаваньня па сказах. У залежнасьці ад правілаў сэгмэнтаваньня пара тэгаў можа быць разьдзеленая паміж двума пасьлядоўнымі сэгмэнтамі, і вынікам праверкі тэгаў будуць паведамленьні пра памылкі з пазначэньнем двух сэгмэнтаў.

2. Апэрацыі з тэгамі

З тэгамі трэба быць пільнымі. Калі іх выпадкова зьмяніць, можа быць парушанае фарматаваньне канчатковага файла. Асноўнае правіла: пасьлядоўнасьць тэгаў павінна захоўвацца ў тым самым парадку. Тым ня менш, пры строгім выкананьні пэўных правілаў, з гэтага агульнага правіла можна рабіць пэўныя выключэньні.

Дубляваньне тэгаў:

Каб прадубляваць групы тэгаў, проста скапіюйце іх у патрэбную пазыцыю. Памятайце, што ў пары тэгаў адчыняльны тэг павінны стаяць перад зачыняльным. Фарматаваньне, прадстаўленае групай, якая дублюецца, будзе ўжытым да абедзвюх частак.

Прыклад:

<b0>Гэтае фарматаваньне</b0> будзе прадубляваным тут.<сэгмэнт 0001>

Пасьля дубляваньня:

<b0>Гэтае фарматаваньне</b0> было <b0>прадубляванае тут</b0>.<сэгмэнт 0001>

Выдаленьне групаў тэгаў:

Каб выдаліць групы тэгаў, проста выдалеце іх з сэгмэнта. Майце на ўвазе, што з групаў, якія складаюцца з пар тэгаў, трэба выдаляць і адчыняльны, і адпаведны зачынены тэгі, каб касаваць адпаведнае фарматаваньне, у адваротным выпадку файл перакладу можа быць пашкоджаны. Пры выдаленьні групы тэгаў з файла перакладу будзе выдаленае адпаведнае фарматаваньне.

Прыклад:

<b0>Гэтае фарматаваньне</b0> будзе выдаленае.<сэгмэнт 0001>

Пасьля выдаленьня:

Гэтае фарматаваньне было выдаленае.<сэгмэнт 0001>

3. Укладаньне групаў тэгаў

Зьмяненьне парадку групаў тэгаў можа спрычыніцца да ўкладаньня адной групы тэгаў у іншую. Гэта прымальна пры ўмове, што адна група цалкам ахоплівае іншую, укладзеную групу. Іншымі словамі, пры перамяшчэньні парных тэгаў і адчыняльны, і зачыняльны тэгі павінны апынуцца або ўнутры, або звонку іншай пары тэгаў, каб файл перакладу ня быў пашкоджаны і яго можна было адчыніць.

Прыклад:

<b0>Фарматаваньне</b0> <b1>раз</b1> будзе ўкладзенае ў фарматаваньне нуль.<сэгмэнт 0001>

Пасьля ўкладаньня:

<b0>Фарматаваньне <b1>раз</b1></b0> было ўкладзенае ў фарматаваньне нуль.<сэгмэнт 0001>

4. Перакрыцьцё групаў тэгаў

Перакрыцьцё зьяўляецца вынікам няправільных апэрацыяў з парамі тэгаў і гарантавана спрычыніцца да пашкоджаньня фарматаваньня, а часам файл перакладу наогул ня будзе адчыняцца.

Прыклад:

<b0>Фарматаваньне</b0> <b1>раз</b1> будзе пашкоджанае.<сэгмэнт 0001>

Пасьля няўдалай апэрацыі:

<b0>Фарматаваньне <b1>раз</b0> </b1>цяпер пашкоджанае.<сэгмэнт 0001>

5. Магчымасьці праверкі тэгаў

Каб наладзіць працу з тэгамі, можна задаць пэўныя правілы праз дыялёг Налады → Апрацоўка тэгаў…:

Парамэтры, вызначаныя тут, будуць дзейнічаць для ўсіх зыходных файлаў, а ня толькі для асобных тыпаў файлаў, напрыклад, фарматаванага тэксту.

  • Зьменныя printf — не правяраць, правяраць простыя, правяраць усе

    OmegaT можа правяраць, ці перайшлі ў пераклад зьменныя тэкстаў праграмаў (тыпу %s). Вы можаце вырашыць, ці не правяраць іх наогул, правяраць простыя зьменныя printf (напрыклад, %s %d і да г. п.), або правяраць зьменныя друку ўсіх тыпаў.

  • Правяраць простыя шаблёны java MessageFormat

    Пры ўключэньні гэтай функцыі OmegaT будзе правяраць, ці правільна апрацоўваюцца простыя тэгі java MessageFormat (тыпу {0}).

  • Рэгулярныя выразы для карыстальніцкіх тэгаў

    Калі тут увесьці рэгулярны выраз, OmegaT будзе ўважаць выяўленыя пасьлядоўнасьці за карыстальніцкія тэгі. Праграма праверыць ідэнтычнасьць колькасьці тэгаў і іх парадку, як гэта робіцца ў дачыненьні да тэгаў OmegaT.

  • Фрагмэнты, якія павінны быць выдаленыя з рэгулярнага выразу ў перакладзе

    Можна ўвесьці рэгулярны выраз для нежаданага зьмесьціва ў перакладзе. Любыя супадзеньні ў перакладзе затым будуць вылучацца чырвоным колерам, каб іх было лёгка знайсьці і выправіць. Пры падборы недакладных супадзеньняў шаблён выдаленьня ігнаруецца. Калі выдаленая частка не адпавядае іншаму сэгмэнту, дадаецца фіксаваны штраф 5, і супадзеньні ніколі ня будуць 100-адсоткавымі.

6. Праверка групаў тэгаў

Пры праверцы тэгаў выяўляюцца зьмены ў пасьлядоўнасьцях тэгаў (выпадковыя або наўмысныя) і паказваюцца сэгмэнты зь імі. Пры выкарыстаньні гэтай функцыі (Ctrl + Shift + V) адчыняецца дыялёг з усімі сэгмэнтамі, у якіх, верагодна, былі пашкоджаныя тэгі ў перакладах. Функцыя праверкі тэгаў дазваляе лёгка рапараваць тэгі і аднаўляць дакумэнты перакладаў. Пры націсканьні Ctrl + Shift + V зьяўляецца вакно з 3-слупковай табліцай, якая ўтрымлівае спасылку на сэгмэнт, зыходны сэгмэнт і пераклад.

Figure 12.1. Элемэнт праверкі тэгаў

Элемэнт праверкі тэгаў

У мэтах спрашчэньня параўнаньня арыгіналу і перакладу тэгі вылучаюцца паўтлустым шрыфтам і сінім колерам. Націсьнеце на спасылку, каб адчыніць сэгмэнт у вакне рэдагаваньне. Выпраўце памылку па неабходнасьці (у выпадку вышэй не хапае пары <i2> </i2>) і націсьнеце Ctrl + Shift + V, каб зноў выклікаць акно праверкі тэгаў і выправіць іншыя памылкі. Памылкі тэгаў — гэта пасьлядоўнасьці тэгаў, парадак і колькасьць якіх у тэксьце перакладу не адпавядае парадку і колькасьці ў арыгінале. У шэрагу выпадкаў маніпуляцыі з тэгамі неабходныя і пажаданыя, у іншых выпадках яны спрычыняюцца да памылак пры кампіляцыі перакладу.

7. Парады наконт кіраваньня тэгамі

Спрашчайце арыгінал

Тэгі, як правіла, прадстаўляюць пэўнае фарматаваньне тэксту арыгіналу. Спрашчэньне фарматаваньня зыходнага тэксту значна зьмяншае колькасьць тэгаў. Па магчымасьці сьлед уніфікаваць выкарыстаныя гарнітуры, кегелі, колеры і да г. п., каб спрасьціць перакладаньне і скараціць колькасьць магчымых памылак тэгаў. Падрабязьней пра тое, што можна рабіць з тэгамі, гл. у разьдзеле “Апэрацыі з тэгамі”. Памятайце, што ў выпадку праблемы з тэгамі ў OmegaT, калі фарматаваньне ня вельмі важнае для перакладу, найлягчэйшым шляхам да вырашэньня праблемаў можа быць выдаленьне тэгаў.

Зьвяртайце асаблівую ўвагу на пары тэгаў

Калі трэба бачыць тэгі ў OmegaT, але ня трэба захоўваць большую частку фарматаваньня ў перакладзе, можна не ўключаць тэгі ў пераклад. У падобным выпадку будзьце асабліва ўважлівымі да параў тэгаў, таму што калі выдаліць адну частку пары, але пакінуць іншую, гэта гарантавана спрычыніцца да пашкоджаньня фарматаваньня ў дакумэньце перакладу. Паколькі тэгі ўключаюцца ў тэкст, можна выкарыстоўваць правілы сэгмэнтаваньня, каб атрымліваць сэгмэнты зь меншай колькасьцю тэгаў. Гэта — функцыя, правільнае ўжываньне якой патрабуе пэўнага досьведу.

OmegaT ня мае магчымасьці цалкам аўтаматычна выяўляць памылкі фарматаваньня, таму вы будзеце атрымліваць паведамленьні пра памылкі і прапановы зьмяніць фарматаваньне ў адпаведнасьці з асаблівасьцямі мовы перакладу. Часам, аднак, пераклад можа выглядаць дзіўна, або — у горшым выпадку — можа нават не адчыняцца.