Analysing Dependency Structure of Coordination Using Constituency Parser and Dependency Length Minimization
Analysing Dependency Structure of Coordination Using Constituency Parser and Dependency Length Minimization
Abstrakt (PL)
Niniejsza praca dostarcza empirycznych argumentów na temat rzeczywistej struktury zależnościowej koordynacji, analizując binarne koordynacje występujące w Corpus of Contemporary American English pod kątem minimalizacji długości zależności. Osiąga się to poprzez wykorzystanie parsera składnikowego Berkeley Neural Parser do wyodrębnienia struktury składniowej zdań, a następnie zastosowanie specjalnie zaprojektowanego kodu w celu pozyskania członów koordynacji oraz spójników z wyniku parsera. Analiza otrzymanych danych pokazuje ogólną tendencję do zwiększania proporcji krótszych lewych członów koordynacji względem prawych wraz ze wzrostem bezwzględnej różnicy długości między członami. Zaobserwowany efekt zostaje następnie zestawiony z istniejącymi podejściami do struktury zależnościowej koordynacji, udowadniając, że jeśli minimalizacji długości zależności (DLM) funkcjonuje zarówno na poziomie użycia, jak i gramatyki, najdokładniejszymi podejściami są podejścia symetryczne, w przeciwnym razie, jeśli DLM funkcjonuje tylko na poziomie użycia, najbardziej trafne są podejścia asymetryczne, chociaż wymagają one dodatkowych wyjaśnień dotyczących skali efektu dla różnych pozycji nadrzędnika.
Abstrakt (EN)
This thesis provides empirical arguments to the question of the true dependency structure of coordination by analysing binary coordinations appearing in the Corpus of Contemporary American English in terms of Dependency Length Minimization. This is achieved by using a constituency parser, the Berkeley Neural Parser, to extract the syntactic structure of the sentences, and later applying custom code to retrieve the conjuncts and the coordinator from the parser output. The analysis of the data shows a general tendency for the increase in proportion of shorter left conjuncts with the rise of absolute length difference between conjuncts. This effect is then juxtaposed with the existing approaches to dependency structure of coordination, proving that if DLM functions both at level of usage and grammar, the most accurate approaches are the symmetrical approaches, otherwise, if DLM functions only at level of usage, the most accurate approaches are the asymmetrical ones, although they require additional explanation regarding the scale of the effect for different governor positions.
Analiza struktury zależnościowej koordynacji z wykorzystaniem parsera składnikowego i minimalizacji długości zależności