Bachelor thesis
No Thumbnail Available
License

ClosedAccessClosed Access

Evaluation of the Effectiveness of Statistical Translation Based on EU Legal Texts

Author
Tiałowska, Agata
Promoter
Błaszczak, Agnieszka
Publication date
2024
Abstract (PL)

Pomoce tłumaczeniowe i tłumaczenie maszynowe stały się nieodłączną częścią zawodu tłumacza. Systemy tłumaczenia maszynowego można dostosować do specyficznych potrzeb użytkownika pod względem, na przykład, dziedziny tłumaczenia lub typu systemu tłumaczenia maszynowego – wraz z zaletami i wadami danego typu. Uzyskanie prostego systemu statystycznego jest procesem przyjaznym dla początkujących dzięki oprogramowaniu open-source dostępnemu w Internecie, pod warunkiem, że spełnione są wymagania systemowe i sprzętowe oraz dostępny jest dwujęzyczny korpus równoległy. Na dowód tego autorka niniejszej pracy postanowiła stworzyć i ocenić prosty system SMT z wykorzystaniem korpusów dostępnych do pobrania na stronach Unii Europejskiej i jedynie istniejących już narzędzi open-source. W pracy przedstawiono podstawowe procedury pozwalające na stworzenie i podstawową ocenę statystycznego systemu tłumaczenia maszynowego z wykorzystaniem Moses SMT. Wytrenowany system pozwala na przyswojenie angielskich tekstów prawnych UE przez odbiorców rozumiejących język niemiecki. System zdecydowanie nie nadaje się do zastosowań komercyjnych ze względu na niską jakość. Głównymi przyczynami takiego wyniku są ograniczenia czasowe, brak wiedzy specjalistycznej autorki oraz kwestie związane z danymi treningowymi.

Abstract (EN)

Translation aids and machine translation have become inseparable parts of the translator's profession. A machine translation system may be created according to the specific needs of a user in terms of e.g. translation domain or machine translation system type – along with the type’s advantages and disadvantages. Provided the operating system and hardware requirements are fulfilled and a bilingual parallel corpus is available, obtaining a simple SMT system is a beginner-friendly process, thanks to open-source software available on the Internet. As a proof of that the author of this thesis tried to create and evaluate a simple SMT system using corpora provided by the European Union and only already existing open-source tools. This thesis presents the fundamental procedures allowing for the creation and basic evaluation of a statistical machine translation system using Moses SMT. The system trained allows for assimilation of English EU legal texts for German-understanding recipients. The system is definitely not suitable for commercial applications due to its low-quality. The main causes for such an outcome are time constraints, the lack of expertise of the author and issues related to the training data.

Keywords EN
machine translation
statistical machine translation
translation aids
translation tools
Moses SMT
Alternative Title
Ewaluacja skuteczności tłumaczenia statystycznego na podstawie unijnych tekstów prawnych
Publisher
University of Warsaw
Defence date
2024-07-04
Open access license
Closed access