The role of world knowledge in Quantifier Scope Disambiguation: a corpus-based approach
The role of world knowledge in Quantifier Scope Disambiguation: a corpus-based approach
Abstrakt (PL)
Zdania zawierające wiele kwantyfikatorów często prowadzą do niejednoznaczności zasięgowych i interpretacyjnych. Rozstrzyganie zasięgu kwantyfikatorów uznawane jest za proces zależny zarówno od struktury składniowej, jak i od wiedzy leksykalno-semantycznej. Niniejsza praca bada wkład mechanizmów algorytmicznych oraz heurystycznych w zadanie rozstrzygania niejednoznaczności zasięgu kwantyfikatorów. Mechanizmy algorytmiczne są operacjonalizowane jako rola gramatyczna, natomiast mechanizmy heurystyczne jako informacja leksykalno-semantyczna. Wykorzystując podejście oparte na uczeniu maszynowym, zadanie rozstrzygania zasięgu kwantyfikatorów sformułowano jako problem klasyfikacji. Wytrenowano i oceniono kilka modeli, które różniły się wyłącznie zastosowanymi cechami językowymi, takimi jak rola gramatyczna, leksykalizacja kwantyfikatorów, dystrybucyjne reprezentacje wektorowe kwantyfikatorów oraz reprezentacje relacji semantycznych między nimi. Wyniki pokazują, że modele wykorzystujące informację leksykalną i semantyczną osiągają istotnie lepsze rezultaty niż model opierający się wyłącznie na roli gramatycznej. Połączenie reprezentacji wektorowych kwantyfikatorów oraz relacji między nimi prowadzi do najwyższej efektywności klasyfikacji, natomiast dodanie informacji o roli gramatycznej do modelu opartego na reprezentacjach wektorowych nie skutkuje statystycznie istotną poprawą wyników. Uzyskane rezultaty stanowią obliczeniowe potwierdzenie modelu przetwarzania zdań „najpierw heurystyki, potem algorytmy” oraz podkreślają kluczową rolę wiedzy leksykalno-semantycznej w rozstrzyganiu zasięgu kwantyfikatorów.
Abstrakt (EN)
Sentences containing multiple quantificational expressions often give rise to scope ambiguities. Scope resolution has been argued to depend on both syntactic structure and lexical–semantic knowledge. This thesis investigates the relative contribution of algorithmic mechanisms — operationalised here as grammatical role — and heuristic mechanisms — operationalised as lexical–semantic information — to the quantifier scope disambiguation task. Leveraging a machine learning approach, quantifier scope disam- biguation is formulated as a pairwise classification task. Several models are trained and evaluated that differ only in the linguistic features incorporated, including grammatical role, lexical realisation of quantifiers, distributional embeddings of quantifiers, and embeddings of semantic relations between them. The results show that models using lexical and semantic information substantially outperform those relying solely on grammatical role. Combining embeddings of quantifiers and relations between them yields the highest accuracy, while adding grammatical role on top of the embedding information does not result in a statistically significant improvement. These findings provide computational support for the “Heuristic first, algorithmic second” model of sentence comprehension from a computational perspective and emphasise the central role of lexical–semantic knowledge in quantifier scope resolution.
Rola wiedzy o świecie w rozstrzyganiu zasięgu kwantyfikatorów - badanie korpusowe