Praca magisterska
Brak miniatury
Licencja

ClosedAccessDostęp zamknięty

Cross-lingual emotion analysis using large language models

Autor
Rajtor, Magdalena
Promotor
Kobyliński, Łukasz
Zubek, Julian
Data publikacji
2024
Abstrakt (PL)

W tej pracy rozważam problem rozpoznawania emocji w kontekście wielu języków. Przede wszystkim, rozpatruję trudności wynikające z używania do tego zadania dużych modeli językowych. Tymi problemami, dla większości języków, jest brak ręcznie oznaczonych zbiorów danych o wysokiej jakości, a także pretrenowanych klasyfikatorów emocji. Próbuję na dwa sposoby sprawdzić, czy uczenie transferowe może okazać się dobrym rozwiązaniem w tym przypadku. Mianowicie, porównuję bezpośredni fine-tuning dla każdego języka do sekwencyjnego dopasowywania, oraz treningu wielojęzycznego. Dodatkowo, przeprowadzam międzyjęzykową analizę części mowy. Na podstawie zaobserwowanych tam wzorców pogłębiam zarówno zrozumienie samego zbioru danych, jak i uzyskanych wyników w różnych konfiguracjach modeli dla każdego języka. Wybrałam Twittera jako źródło moich danych, ze względu na jego dostępność, aktualność oraz wyjątkowość w wyrażaniu emocji. Wpisy pochodzą ze zbiorów danych oznaczonych emocjami w siedmiu różnych językach (polski, angielski, hiszpański, indonezyjski, arabski, turecki oraz perski). Po dyskusji wyników, przedstawiam napotkane ograniczenia oraz sugestie w kierunku przyszłych badań. W pracy mam nadzieję podkreślić istotność prowadzenia badań nad problemem rozpoznawania emocji, zwłaszcza w kontekście języków z mniejszą ilością zasobów.

Abstrakt (EN)

In this thesis I consider the problem of multilingual emotion recognition. Primarily, I explore the challenges of performing this task using large language models. For most languages, they are the lack of good quality labelled data and pre-trained emotion classifiers. I investigate two approaches based on transfer learning, to establish whether they could mitigate those issues. That is, I compare direct fine-tuning on each language to sequential fine-tuning and multilingual training. Additionally, I conduct a cross-lingual Part of Speech analysis. I leverage the observed patterns to explore further both the data, and the best-performing model configurations for each language. I chose Twitter as the source of my data, because of its accessibility, topicality and uniqueness in emotional expression. The tweets came from emotion-labelled datasets in seven different languages (Polish, English, Spanish, Indonesian, Arabic, Turkish and Persian). After discussing the results, I outline the limitations and include suggestions for further studies. I hope to emphasize the importance of conducting research on emotion recognition, especially with low-resource languages.

Słowa kluczowe PL
uczenie transferowe
klasyfikacja emocji
wielojęzyczne
Twitter
XLM-RoBERTa
Inny tytuł
Analiza emocji pomiędzy językami z wykorzystaniem dużych modeli językowych
Wydawca
Uniwersytet Warszawski
Data obrony
2024-09-26
Licencja otwartego dostępu
Dostęp zamknięty