Segmenty w projektach tłumaczeniowych

Jedną z największych zalet programów CAT jest dzielenie tekstu na segmenty, dzięki czemu ułatwiają skupienie nad jednym fragmentem tekstu. Dodatkowo, dzięki segmentom, można korzystać z dobrodziejstwa (a dla niektórych – przekleństwa) pamięci tłumaczeniowych.

Warto zadać sobie pytanie – jak prawidłowo dzielić segmenty, by praca nad tłumaczeniem: trwała jak najkrócej, prowadziła do powstania dobrej jakościowo pamięci tłumaczeniowej?

Pierwszy punkt, moim zdaniem, jest często bagatelizowany, co znacznie wydłuża pracę nad tłumaczeniem. Przykładowo – gdy kilka lat temu zaczynałem pracę jako tłumacz i dostałem duże zlecenie, wykonywałem je w programie OmegaT. Ogromnym utrudnieniem było dla mnie wtedy to, że aplikacja dzieliła tekst nie na poziomie samych zdań, a zamiast tego, łączyła je w długie sekwencje. Przetłumaczenie takiego fragmentu na kilka linijek tekstu, jest znacznie trudniejsze.

Warto przeanalizować przyczynę problemu – w tym przypadku na końcu wielu zdań pojawiały się przypisy w nawiasach kwadratowych i program do tłumaczeń uznawał, że to miejsce musi być połączone z następnym zdaniem.

Do czego prowadzi taki błąd?

Segmenty tłumaczeniowe, zamiast jednego lub dwóch zdań, składają się wtedy z kilku. W takiej sytuacji nie będziesz mógł wykorzystać pamięci tłumaczeniowej w przyszłości. Z pewnością nie jest to dobry sposób na pracę przy projektach tłumaczeniowych. Podobne kłopoty mogą zaistnieć dla niektórych plików PDF.

Jak rozwiązać ten problem?

Są dwa rozwiązania – możesz albo poprawić go na poziomie ogólnej segmentacji, albo (gdy nieprawidłowa segmentacja pojawia się tylko w niektórych miejscach), pozbyć się jej ręcznie. Wyobraź sobie, że masz do przetłumaczenia 100 stronicowy plik PDF i każda linijka tekstu jest osobnym segmentem, co oznacza, że musisz je łączyć, by stanowiły prawidłowe zdania. W takiej sytuacji wykonasz operację łączenia segmentów co kilka minut i z pewnością nie będzie to komfortowe.

Znacznie łatwiej jest albo poprawić błąd w pliku źródłowym, albo zastosować odpowiednie reguły dzielenia segmentów.

Przykładowo – jeśli problem pojawia się dlatego, że program nie wie, jak reagować na nawiasy kwadratowe (jak w moim przypadku), można użyć opcji wyszukaj i zamień w edytorze tekstu i wstawić po nawiasie dodatkowy znak, który spowoduje podzielenie segmentu. Może być to na przykład znak końca linii. Po przetłumaczeniu tekstu, trzeba wykonać odwrotną operację i tym samym poleceniem usunąć wstawione znaki. Gdy problem polega na nieprawidłowym formatowaniu pliku (na przykład ktoś wstawiał enter na końcu każdego wiersza), to warto o tym powiedzieć klientowi i przesłać mu tekst, który jest sformatowany w prawidłowy sposób.

Inną metodą jest zapoznanie się z wyrażeniami regularnymi, czyli prawidłowe podzielenie tekstu już w aplikacji CAT.

Jak dzielić segmenty ręcznie?

Niektóre darmowe programy CAT (jak OmegaT), nie oferują opcji ręcznego dzielenia segmentów z poziomu programu i aby to zrobić, trzeba szukać metod alternatywnych. Czasem dobrym rozwiązaniem jest skorzystanie z najprostszego rozwiązania – sformatowania tekstu źródłowego i ponownego wczytania projektu.

W bardziej zaawansowanych programach można w prosty sposób łączyć i dzielić segmenty, co pozytywnie wpływa na wydajność pracy. Jeśli musisz to robić dziesiątki razy, sprawdź czy nie można zastosować jakichś reguł, które sprawią, że tekst zostanie automatycznie podzielony w lepszy sposób.

Jeśli istnieje, to warto go wprowadzić na wczesnym etapie projektu, bo w przeciwnym przypadku, będziesz musiał poprawiać wiele segmentów, które przetłumaczyłeś wcześniej.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *