Licencja
Błędy w tłumaczeniu maszynowym chińskich nazw własnych
Abstrakt (PL)
Celem pracy jest analiza błędów występujących w tłumaczeniu maszynowym nazw własnych z j. chińskiego na j. polski przy użyciu Tłumacza Google. W centrum badania stoi zagadnienie nazw własnych, które stanowią problem wynikający m.in. z niemożliwości stworzenia korpusu uniwersalnego, a także ich niejednoznaczny charakter. Narzędziem wykorzystanym do badania była analiza błędów tekstu wyjściowego. Omawiane błędy zostały podzielone wg 6 kategorii: ortografia, leksyka, gramatyka, semantyka, dyskurs, nieznane słowa, oraz wedle podlegających pod nie podkategorii. W badaniu posłużono się własnym korpusem, stworzonym z względnie prostych zdań, bogatych w nazwy własne. W celu zilustrowania procesu, w pracy przedstawione zostały również strategie segmentacji chińskiego tekstu, a także historia i współczesny wymiar tłumaczenia maszynowego, umieszczające badanie w szerszym kontekście.
Abstrakt (EN)
The aim of the work is to analyze errors occurring in machine translation of proper names from Chinese into Polish using Google Translate. At the center of the study is the issue of proper names. Due to the impossibility of creating a universal corpus, as well as their ambiguous nature, proper names pose a problem in machine translation. The tool used for the study was the error analysis of the output text. The errors discussed were divided into 6 categories: ortography, lexis, grammar, semantic, discourse, unknown words, and according to their subcategories.The corpus, composed of relatively simple sentences rich in proper names, was created for the purpose of the study. To illustrate the process, the work also presents Chinese text segmentation strategies, as well as the history and contemporary dimensions of machine translation, placing the study in a broader context.