Licencja
Dependency structure of English coordination: a surface-syntactic approach
Abstrakt (PL)
Praca opisuje badanie korpusowe na temat koordynacji w języku angielskim. W dotychczasowych badaniach zauważono pewne tendencje występujące przy tworzeniu koordynacji i ich konsekwencje teoretyczne. W oparciu o efekt minimalizowania zależności, wyniki jednego z tych badań dawały argument za symetrycznymi podejściami do struktury zależnościowej koordynacji, z kolei wyniki kolejnego badania dawały argument konkretnie za podejściem wielogłowym. W ramach tej pracy przeprowadzono kontynuację tych badań, ale w celu tworzenia drzew zależnościowych do analizy koordynacji zastosowano schemat Surface-syntactic Universal Dependencies zamiast Universal Dependencies. Wybór ten miał prowadzić do poprawienia jakości danych, ponieważ parsery działające w oparciu o wybrany schemat mają szansę tworzyć więcej poprawnych drzew zależnościowych, a sama struktura drzew tworzonych zgodnie z tym schematem pozwala na większą dokładność w wyszukiwaniu koordynacji. Ostatecznie wybór schematu nie przełożył się na poprawę jakości danych, ale przeprowadzenie analizy koordynacji było nadal możliwe. W pracy zaprezentowane są wyniki ewaluacji użytych podejść do parsowania oraz wyniki analizy koordynacji, które wskazują na jedną z symetrycznych interpretacji koordynacji. Wyniki te zostały omówione wraz z pewnymi nieoczekiwanymi obserwacjami.
Abstrakt (EN)
This thesis describes a corpus study on coordinate structures in English. Previous studies have shown some tendencies in how coordinations are formed and the theoretical consequences of those tendencies. The Dependency Length Minimisation effect was used to argue for the symmetric approaches to the dependency structure of coordination in one of the previous studies and another argued specifially in favour of the multi-headed approach. This current study continues the research, but using the Surface-syntactic Universal Dependencies instead of Universal Dependencies to create trees for analysis of coordinations. This choice is motivated by the strive to improve the quality of the data by using an annotation scheme that was found to possibly improve parser performance and by taking advantage of the structural qualities of the trees created according to this scheme. The chosen annotation scheme does not necessarily improve the data quality, but still allows for an analysis of coordinations. Evaluation of the discussed parsing strategies is presented, as well as the results of the coordination analysis, which provide some evidence for one of the symmetric interpretations of coordinate structures. Those results are discussed along with some unexpected findings.