Praca magisterska
Brak miniatury
Licencja

ClosedAccessDostęp zamknięty

La traducción automática del lenguaje no binario a base de textos en polaco, español e inglés

Autor
Nowak, Kamila
Promotor
Figiel, Wojciech
Data publikacji
2024
Abstrakt (PL)

Zarówno tłumaczenie maszynowe, jak i narzędzia tłumaczenia maszynowego, posiadają pewne ograniczenia, jeśli chodzi o ich zastosowanie. Jednym z tych ograniczeń jest kwestia uprzedzenia względem płci, jakie prezentują te narzędzia i programy. Objawia się ono tym, że niektóre słowa nacechowane płciowo są tłumaczone zawsze używając jednego rodzaju. Kolejnym ograniczeniem jest również to, że narzędzia tłumaczenia maszynowego potrzebują ogromnych ilości danych, aby ich proces uczenia się był skuteczny, co zdecydowanie działa na niekorzyść języków, które są mniej używane. Z tego też względu wydaje się ciekawym, jak narzędzia tłumaczenia maszynowego podejdą do tłumaczenia języka niebinarnego, używanego nie tylko przez osoby niebinarne, ale wszystkich, którym zależy na inkluzywności w języku. Celem pracy jest zaobserwowanie i przeanalizowanie sposobów używanych narzędzia tłumaczenia maszynowego przy tłumaczeniu tekstów zawierających język niebinarny, jako że wykracza on poza typową binarność płci, a ponadto istnieje stosunkowo mało danych, na podstawie których te narzędzia się uczą. Co więcej, należy zauważyć, że nie istnieje jeden sposób, w jaki wyrażają się osoby niebinarne w danym języku, co jeszcze bardziej komplikuje tę kwestię. W tej pracy przeanalizowano tłumaczenia maszynowe dziewięciu tekstów w trzech językach, tj. polskim, hiszpańskim i angielskim. Wszystkie teksty przetłumaczono na dwa pozostałe języki, które nie są językami tekstu oryginalnego. Do tłumaczenia użyto trzech najpopularniejszych narzędzi tłumaczenia maszynowego: DeepL, Google Translate i Microsoft Bing Translator. W wyniku przeprowadzonej analizy okazało się, że wszystkie te narzędzia mają ograniczone możliwości jeśli chodzi o rozpoznanie i tłumaczenie języka niebinarnego, najczęściej zamieniając formy niebinarne na rodzaj męski.

Abstrakt (EN)

Both machine translation itself and machine translation tools have certain limitations when it comes to their use. One of these limitations is the issue of gender bias that these tools and programs present. This manifests itself in the fact that some gendered words are always translated using one gender. Another limitation is also that machine translation tools need huge amounts of data for their learning process to be effective, which works against resource-poor languages. For this reason, it seems interesting to see how machine translation tools would approach the translation of non-binary language, used not only by non-binary people, but anyone for whom inclusive language is important. The aim of the work is to observe and analyse the ways used by these tools when translating texts containing non-binary language, as it goes beyond the typical gender binary, and there is relatively little data on which machine translation tools could learn. Furthermore, it is important to note that there is no single way in which non-binary people express themselves in a given language, further complicating the issue. This thesis will analyse the machine translations of nine texts in three languages, namely Polish, Spanish and English. All texts will be translated into the other two languages, which are not the languages of the original text. Three of the most popular machine translation tools will be used for the translation: DeepL, Google Translate and Microsoft Bing Translator. As a result of the analysis, it has been found that all these tools have limited capabilities in recognising and translating non-binary language, most of the time converting non-binary forms to the male gender.

Abstrakt (inny)

Tanto la traducción automática en sí como las herramientas de traducción automática tienen ciertas limitaciones a la hora de utilizarlas. Una de estas limitaciones es la cuestión del perjuicio de género que presentan estas herramientas y programas. Otra limitación es que las herramientas de traducción automática necesitan grandes bases de datos para que su proceso de aprendizaje sea eficaz, lo que desfavorece las lenguas con pocos recursos. Por este motivo, parece interesante investigar cómo las herramientas de traducción automática abordarían la traducción del lenguaje no binario, utilizado no solo por las personas no binarias, sino por cualquier persona que opta por la mayor inclusividad en su lenguaje. El objetivo de este artículo es observar y analizar las formas en que se utilizan las herramientas de traducción automática a la hora de traducir textos que contienen lenguaje no binario, ya que va más allá de la típica binaridad de género, y existen relativamente pocos datos de los que puedan aprender estas herramientas. Además, es importante señalar que no existe una única forma de expresarse en una lengua para las personas no binarias, lo que complica aún más esta cuestión. En este trabajo se ha analizado las traducciones automáticas de nueve textos en tres idiomas, a saber, polaco, español e inglés. Todos los textos se han sido traducidas a las otras dos lenguas, que no son las lenguas del texto original. Para la traducción se ha utilizado tres de las herramientas de traducción automática más populares: DeepL, Google Translate y Microsoft Bing Translator. El objetivo del trabajo es observar y analizar las formas utilizadas por estas herramientas a la hora de traducir textos que contengan lenguaje no binario. Como resultado del análisis, se ha averiguado que todas estas herramientas tienen capacidades limitadas a la hora de reconocer y traducir el lenguaje no binario, convirtiendo la mayoría de las veces las formas no binarias al género masculino.

Słowa kluczowe PL
język niebinarny
tłumaczenie maszynowe
język inkluzywny
tłumaczenie neuronowe
niebinarność
DeepL
Google Translate
Microsoft Bing Translator
Inny tytuł
Tłumaczenie maszynowe języka niebinarnego na przykładzie tekstów w języku polskim, hiszpańskim i angielskim
Wydawca
Uniwersytet Warszawski
Data obrony
2024-09-16
Licencja otwartego dostępu
Dostęp zamknięty