Praca magisterska
Brak miniatury
Licencja

ClosedAccessDostęp zamknięty

Los grandes modelos de lenguaje como potencial fuente de la audiodescripción automática de arte. El caso de las herramientas Copilot y Be My Eyes/AI en las versiones polaca y española

Autor
Kostyra, Weronika
Promotor
Figiel, Wojciech
Data publikacji
2024
Abstrakt (PL)

Celem pracy jest zbadanie, na przykładzie zastosowania dwóch narzędzi Copilot i Be My Eyes/AI, czy duże modele językowe można uznać za potencjalne źródło audiodeskrypcji sztuki oraz ustalenie, który z nich sprawdził się lepiej w przygotowaniu opisów i w jakiej wersji językowej. Aby to sprawdzić i ocenić dokładność tych narzędzi oraz ich wydajność i jakość na podstawie ustalonych kryteriów w ramach dobrych praktyk, przeanalizowano opisy dzieł należących do najistotniejszych nurtów artystycznych wygenerowanych zarówno przez Copilota, jak i Be My Eyes/AI, w języku polskim i hiszpańskim. W części teoretycznej dokonano przeglądu kluczowych pojęć związanych z problematyką niniejszej pracy, a także przedstawiono definicje przedmiotów analizy, zwracając uwagę na ich tło zarówno historyczne, jak i prawne. Wszystko to nie tylko pozwoliło potwierdzić możliwość dużych modeli językowych, tj. Copilot i Be My Eyes/AI, do bycia potencjalnymi źródłami audiodeskrypcji sztuki, ale także pozwoliło zaproponować pewne rekomendacje dotyczące ich ulepszenia w świetle problematycznych kwestii zidentyfikowanych podczas analizy.

Abstrakt (EN)

The aim of this thesis is to study, according to the case of the Copilot and Be My Eyes/AI tools, whether Large Language Models could be considered a potential source for automatic audio description of art and to determine which one performed better while preparing descriptions and in which language version. In order to ascertain the accuracy of these tools, their efficiency and quality, the descriptions of artworks, which belonged to the most relevant artistic movements and which were generated by both: Copilot and Be My Eyes/AI, in Polish and Spanish versions, were subjected to the analysis based on the established criteria within the framework of the good practices. The theoretical part of the thesis discussed the most substantial concepts related to the raised problematic issues, as well as definitions of the analysed objects, including their historical and legal background. All this not only allowed to confirm the possibility of Large Language Models, i.e. Copilot and Be My Eyes/AI, to be a potential source for audio description of art, but also allowed for suggesting some recommendations for their improvement in the light of the problematic issues identified during the analysis.

Abstrakt (inny)

El objetivo del presente trabajo reside en investigar, basándose en el caso de las dos herramientas Copilot y Be My Eyes/AI, si los grandes modelos de lenguaje podrían considerarse potencial fuente de la audiodescripción automática de arte, así como determinar cuál de las dos acabó rindiendo mejor y en qué versión lingüística. Para ello, en aras de evaluar su exactitud, eficacia y calidad y valiéndose de los criterios establecidos a modo de buenas prácticas, se han sometido al análisis las descripciones de obras –pertenecientes a las corrientes artísticas más sustanciales– generadas tanto por Copilot como por Be My Eyes/AI, en polaco y en español. En la parte teórica se ha efectuado un recorrido por los conceptos pertinentes ligados a la problemática del presente trabajo como también se han brindado definiciones de objetos del análisis, incluyendo su trasfondo tanto histórico como legal. Todo esto no solo permitió corroborar la disposición de los grandes modelos de lenguaje, es decir, de Copilot y Be My Eyes/AI, para ser potencial fuente de la audiodescripción automática de arte, sino que también permitió proporcionar ciertas recomendaciones respecto a su mejora al amparo de las cuestiones problemáticas identificadas durante el análisis.

Słowa kluczowe PL
duże modele językowe
audiodeskrypcja
ChatGPT
Copilot
Be My Eyes/AI
prompt
obrazy
nurty w sztuce
wygenerowane opisy
dobre praktyki
kwestie problematyczne
skuteczność
wersja językowa polska i hiszpańska
osoby niewidome i słabowidzące
Inny tytuł
Duże modele językowe jako potencjalne źródło audiodeskrypcji sztuki. Analiza zastosowania narzędzi Copilot i Be My Eyes/AI w wersji polskiej i hiszpańskiej
Wydawca
Uniwersytet Warszawski
Data obrony
2024-07-08
Licencja otwartego dostępu
Dostęp zamknięty