Licencja
Związek analizy nastrojów artykułów prasowych z fluktuacją cen pszenicy. Użyteczność dla modeli predykcyjnych
Abstrakt (PL)
Analiza nastrojów jest narzędziem pozwalającym mierzyć i obrazować tendencje emocjo nalne tekstów. Oprócz klasycznego zastosowania w obszarze badania opinii publicznej czy w przestrzeni mediów społecznościowych, w pracy podjęto zagadnienie wykorzystania analizy nastrojów do badania nacechowania emocjonalnego tytułu nagłówków prasowych zawierają cych słowo pszenica, a więc w kontekście ekonomicznym. Celem badań było sprawdzenie czy istnieje związek między fluktuacjami cen pszenicy w danym okresie a zmianą nacechowania emocjonalnego odpowiednio na pozytywne lub negatywne w tytułach artykułów prasowych, publikowanych w tym samym okresie, zawierających słowo pszenica. Do analizy nastrojów wykorzystano uczenie nienadzorowane oparte na leksykonie SentiWordNet, przypisując do ty tułów nagłówków punkty polaryzacji, a następnie określając nacechowanie emocjonalne tytułu. Wyniki te następnie porównano ze zmianą trendu cenowego pszenicy w tym samym okresie. W celu weryfikacji korelacji obu trendów zastosowano testy statystyczne i zmierzono istotność wyników. Postawioną hipotezę odrzucono ze względu na niejednoznaczne oraz miejscami trudne do interpretacji dane. Wynik ten jednak nie oznacza kompletnego braku związku między obiema danymi, a przede wszystkim zwraca uwagę na specyfikę danych. Analiza nastrojów nagłówków prasowych poruszających tematykę ekonomiczną i zgłębiającą zagadnienia gospo darcze wymaga nie tylko podejścia lingwistycznego, ale również odpowiedniej interpretacji w ramach poruszanego kontekstu. Zauważono jednak, że zależnie od tytułu publikacji, nagłówki prasowe artykułów publikowanych tego samego dnia mają różne nacechowanie emocjonalne, co może wskazywać na stronniczość wydawnictw. W przypadku wykorzystania metod opar tych na leksykonie interpretacja nagłówków nie jest możliwa, dlatego wyniki uzyskane z uży ciem SentiWordNet mogą nie być zadowalające. W takim wypadku pojawia się pytanie, czy użycie uczenia nadzorowanego z wykorzystaniem wcześniej przypisanych etykiet danych, np. wykorzystując sieci neuronowe przyniosłoby lepsze efekty. Zagadnienie to stanowi pole do dalszych rozważań i badań oraz wykazuje potencjał wykorzystania analizy nastrojów w mode lach predykcyjnych.