Praca licencjacka
Brak miniatury
Licencja

ClosedAccessDostęp zamknięty

Językowe cechy tekstów wygenerowanych przez sztuczną inteligencję. Analiza stylometryczna na podstawie korpusu recenzji filmowych

Autor
Stańczak, Kinga
Promotor
Będkowski, Marcin
Data publikacji
2024
Abstrakt (PL)

Celem pracy jest zbadanie różnic stylistycznych między tekstami wygenerowanymi przez sztuczną inteligencję a tekstami napisanymi przez ludzi. Podstawą analizy jest stworzony na potrzeby pracy korpus, składający się z 200 recenzji filmowych, z których połowa została wygenerowana przez ChatGPT-3.5. Różnice pomiędzy tekstami wyodrębniono metodami stylometrycznymi, z wykorzystaniem pakietów StyloMetrix oraz scikit-learn. Praca składa się z dwóch rozdziałów, z których pierwszy jest rozdziałem teoretycznym, a drugi – empirycznym. Rozdział teoretyczny zawiera przegląd literatury dotyczącej wykrywania tekstów wygenerowanych przez AI oraz omówienie metodologii zastosowanej w pracy. Część empiryczna zaczyna się od opisu wykorzystanego korpusu, a następnie prezentuje analizę wyników trenowania drzew decyzyjnych i lasu losowego. Zakończenie pracy zawiera wnioski dotyczące cech stylistycznych tekstów, a także potencjalny dalszy kierunek badań na temat wykrywania tekstów wygenerowanych przez sztuczną inteligencję.

Słowa kluczowe PL
stylometria
językoznawstwo korpusowe
generatywna sztuczna inteligencja
ChatGPT
drzewa decyzyjne
StyloMetrix
Inny tytuł
The language of AI-generated texts. A stylometric analysis based on a corpus of film reviews
Wydawca
Uniwersytet Warszawski
Data obrony
2024-09-06
Licencja otwartego dostępu
Dostęp zamknięty