Licencja
Możliwości wykorzystania dużych modeli językowych (LLM) w procesie wyszukiwania informacji w cyfrowych zbiorach nieustrukturyzowanych
Abstrakt (PL)
Kluczowym zagadnieniem procesu wyszukiwania informacji jest odnalezienie relewantnych dokumentów na podstawie zapytań użytkowników. Proces ten wymaga od systemów wyszukiwawczych zaawansowanych zdolności interpretacji języka naturalnego. W ostatnich latach duże modele językowe (LLM) zrewolucjonizowały podejście do przetwarzania języka, wykazując się wyjątkowymi umiejętnościami w zakresie rozumienia i generowania tekstu. Niniejsza praca wskazuje na obszary synergii między dużymi modelami językowymi a tradycyjnymi systemami informacyjno-wyszukiwawczymi, ze szczególnym uwzględnieniem modeli generatywnych i wyszukiwarek internetowych. W toku pracy wykazano, że zastosowanie dużych modeli językowych w ramach architektury komputerowych systemów informacyjno-wyszukiwawczych może mieć pozytywny wpływ na relewancję zwracanych wyników. LLM są w stanie realizować zadania z zakresu przetwarzania zapytań, indeksowania dokumentów oraz generowania złożonych odpowiedzi na pytania użytkowników. Stwierdzono również, że rozwiązania hybrydowe mają neutralny lub potencjalnie negatywny wpływ na rzetelność otrzymywanych informacji.
Abstrakt (EN)
A key issue in the information retrieval process is finding relevant documents based on user queries. This process requires search systems to have advanced natural language processing capabilities. In recent years, large language models (LLMs) have revolutionized the field of natural language processing, demonstrating exceptional abilities in understanding and generating text. This thesis highlights areas of synergy between large language models and traditional information retrieval systems, with particular emphasis on generative models and web search engines. The study shows that applying large language models within the architecture of information retrieval systems can have a positive impact on the relevance of returned results. LLMs are capable of performing tasks related to query processing, document indexing, and generating complex responses to user questions. It was also found that hybrid solutions have a neutral or potentially negative impact on the reliability of the obtained information.