Licencja
A comparative analysis of YouTube’s English machine-translated subtitles of the French series Skam France
Abstrakt (PL)
Niniejsza praca ma na celu porównanie jakości tłumaczenia napisów dostępnych w serwisie YouTube wykonanego przez profesjonalnego tłumacza z tłumaczeniami maszynowymi. Praca składa się z dwóch rozdziałów: teoretycznego i analitycznego. Pierwszy rozdział zawiera omówienie historii i metod tłumaczenia maszynowego. Następnie zostały wymienione i krótko opisane przeszłe projekty tłumaczenia maszynowego dotyczące napisów. W następnej sekcji zaprezentowano i pokrótce omówiono techniczne aspekty tworzenia napisów. Pierwszy rozdział kończy się opisem procesu powstawania napisów do filmów w serwisie YouTube. Drugi rozdział zaczyna się od omówienia wyboru materiału badawczego i szczegółowego opisania sposobu, w jaki zostało przeprowadzone badanie. W kolejnych częściach tego rozdziału wyniki analizy zostały przedstawione i omówione na konkretnych przykładach z analizowanych napisów. Analizowane rodzaje napisów zostały również porównane ze sobą pod względem ilości, rodzaju i wagi występujących w nich błędów. Głównym wnioskiem wynikającym z badania jest to, że w napisach tłumaczonych przez człowieka wystąpiło procentowo ogólnie najmniej błędów, a napisy te charakteryzowały się największą liczbą błędów tylko w kategoriach, w których błędy popełniają typowo ludzie, czyli gdy napisy były zbyt lub nie dość szczegółowe. Błędy popełniane przez człowieka zwykle nie były też poważne. Badanie pokazało również, że tłumaczenie maszynowe napisów generowanych za pomocą automatycznego rozpoznawania mowy charakteryzowało się większą ilością błędów w aspektach technicznych niż tłumaczeniowych. Ilość błędów w segmentacji i interpunkcji była na tyle wysoka, że ogólny wynik w liczbie błędów i ich wadze dla tej kategorii był najwyższy spośród wszystkich analizowanych rodzajów napisów.
Abstrakt (EN)
This thesis aims to compare the quality of translation of subtitles available on YouTube made by a professional translator with machine translations. The thesis consists of two chapters: theoretical and analytical. The first chapter discusses the history and methods of machine translation. Past subtitle machine translation projects are then listed and briefly described. The next section presents and briefly discusses the technical aspects of subtitling. The first chapter ends with a description of the process of creating subtitles for YouTube videos. The second chapter begins with a discussion of the selection of research material and a detailed description of how the study was conducted. In the subsequent parts of this chapter, the results of the analysis are presented and discussed using specific examples from the analysed subtitles. The analysed types of subtitles were also compared with each other in terms of the number, type and severity of errors occurring in them. The main conclusion of the study is that human-translated subtitles had the lowest overall percentage of errors, and these subtitles were characterized by the highest number of errors only in categories where errors are typically made by humans, i.e. when the subtitles were too detailed or not detailed enough. Errors committed by a human translator were usually not serious either. The study also showed that machine translation of subtitles generated using automatic speech recognition was characterized by more errors in technical aspects than in translation aspects. The number of errors in segmentation and punctuation was so high that the overall result in the number of errors and their severity for this category was the highest among all analysed types of subtitles.