Struktura zależnościowa koordynacji – analiza korpusów Universal Dependencies
Struktura zależnościowa koordynacji – analiza korpusów Universal Dependencies
Abstrakt (PL)
Istnieje wiele poglądów na temat struktury zależnościowej koordynacji, czyli konstrukcji współrzędnie złożonej. W literaturze opisane są cztery główne podejścia – model praski, londyński, stanfordzki i moskiewski (Popel i in., 2013).
Poprzednie badania (Przepiórkowski i Woźniak, 2023) opisują metodę pozwalającą na testowanie poprawności tych modeli. Polega ona na analizie tendencji do umieszczania krótszego członu koordynacji na początku konstrukcji współrzędnie złożonej. Wykorzystuje ona zasadę Dependency Length Minimization (DLM, Temperley 2007), czyli tendencję do formułowania zdań tak, aby łączna długość relacji między słowami w zdaniu była jak najmniejsza. Przepiórkowski i Woźniak (2023) na podstawie analizy koordynacji w korpusie języka angielskiego argumentują za poprawnością modeli symetrycznych, czyli podejścia praskiego i londyńskiego.
Cztery główne modele struktury zależnościowej koordynacji zostały opracowane na podstawie analiz języków inicjalnych, czyli takich, w których głowy znajdują się zwykle na początku fraz. Jednak podejścia te mogą nie opisywać prawidłowo koordynacji w językach finalnych, tj. takich, w których głowa zwykle jest na końcu frazy. Kanayama i in. (2018) postulują wprowadzenie alternatywnych modeli struktury zależnościowej koordynacji dla języków finalnych.
W niniejszej pracy przedstawiam przewidywania 12 modeli struktury zależnościowej koordynacji. Zestawiam je z wynikami analizy korpusów językowych opisanych w standardzie Universal Dependencies (UD, De Marneffe i in. 2021). W badaniu uwzględniono korpusy 13 języków, w tym 9 inicjalnych i 2 finalnych.
Wyniki badania potwierdzają występowanie w języku angielskim tendencji zaobserwowanych w pracy Przepiórkowski i Woźniak (2023). Podobne zależności występują także w języku czeskim oraz w łacinie. Niemniej jednak w pozostałych badanych językach przewidywane tendencje nie zostały zaobserwowane. Pokazuję, że może to wynikać z niewystarczającej ilości oraz złej jakości danych użytych w badaniu. Proponuję poprawę metodologii i dalsze badania dotyczące struktury zależnościowej koordynacji.
Abstrakt (EN)
There are multiple views on the dependency structure of coordination. The literature describes four main approaches – the Prague, London, Stanford, and Moscow models (Popel et al., 2013).
Previous research (Przepiórkowski & Woźniak, 2023) describes a method that tests these models' correctness. It involves analyzing the tendency to place shorter conjunct at the beginning of the coordination. It uses the Dependency Length Minimization principle (DLM, Temperley 2007), i.e. the tendency to formulate sentences so that the total length of the relationships between words in the sentence is as short as possible. Przepiórkowski & Woźniak (2023) based on the analysis of coordinations found in the English corpus argue for the correctness of symmetric models, i.e. the Prague and London approaches.
The four main approaches were developed based on analysis of head-initial languages, i.e. those, in which the head tends to be at the beginning of the phrase. However, these approaches may not correctly describe coordination in head-final languages, i.e. those, in which the head tends to be at the end of the phrase. Kanayama et al. (2018) propose alternative approaches to the dependency structure of coordination in head-final languages.
In this thesis, I present the predictions of 12 dependency structure of coordination models. I compare them with the results of the analysis of coordinations found in Universal Dependencies corpora (UD, De Marneffe et al. 2021). The study examines 13 languages in total, including 9 head-initial and 2 head-final.
The results of the study confirm the tendency observed by Przepiórkowski & Woźniak (2023). Similar tendencies also occur in Czech and Latin. However, in other languages, those tendencies are not observed. I show that this may be due to the insufficient amount and poor quality of data used in the study. I propose improving the methodology and further research on the dependency structure of coordination.
Dependency structure of coordination – an analysis of Universal Dependencies corpora