Licencja
Językowe cechy tekstów wygenerowanych przez sztuczną inteligencję. Analiza stylometryczna na podstawie korpusu recenzji filmowych
Abstrakt (PL)
Celem pracy jest zbadanie różnic stylistycznych między tekstami wygenerowanymi przez sztuczną inteligencję a tekstami napisanymi przez ludzi. Podstawą analizy jest stworzony na potrzeby pracy korpus, składający się z 200 recenzji filmowych, z których połowa została wygenerowana przez ChatGPT-3.5. Różnice pomiędzy tekstami wyodrębniono metodami stylometrycznymi, z wykorzystaniem pakietów StyloMetrix oraz scikit-learn. Praca składa się z dwóch rozdziałów, z których pierwszy jest rozdziałem teoretycznym, a drugi – empirycznym. Rozdział teoretyczny zawiera przegląd literatury dotyczącej wykrywania tekstów wygenerowanych przez AI oraz omówienie metodologii zastosowanej w pracy. Część empiryczna zaczyna się od opisu wykorzystanego korpusu, a następnie prezentuje analizę wyników trenowania drzew decyzyjnych i lasu losowego. Zakończenie pracy zawiera wnioski dotyczące cech stylistycznych tekstów, a także potencjalny dalszy kierunek badań na temat wykrywania tekstów wygenerowanych przez sztuczną inteligencję.