Możliwości wykorzystania dużych modeli językowych (LLM) w procesie wyszukiwania informacji w cyfrowych zbiorach nieustrukturyzowanych

Ślusarski, Michał

Praca magisterska

Licencja

Dostęp zamknięty

Możliwości wykorzystania dużych modeli językowych (LLM) w procesie wyszukiwania informacji w cyfrowych zbiorach nieustrukturyzowanych

Autor

Ślusarski, Michał

Promotor

Gmiterek, Grzegorz

Data publikacji

2024

Abstrakt (PL)

Kluczowym zagadnieniem procesu wyszukiwania informacji jest odnalezienie relewantnych dokumentów na podstawie zapytań użytkowników. Proces ten wymaga od systemów wyszukiwawczych zaawansowanych zdolności interpretacji języka naturalnego. W ostatnich latach duże modele językowe (LLM) zrewolucjonizowały podejście do przetwarzania języka, wykazując się wyjątkowymi umiejętnościami w zakresie rozumienia i generowania tekstu. Niniejsza praca wskazuje na obszary synergii między dużymi modelami językowymi a tradycyjnymi systemami informacyjno-wyszukiwawczymi, ze szczególnym uwzględnieniem modeli generatywnych i wyszukiwarek internetowych. W toku pracy wykazano, że zastosowanie dużych modeli językowych w ramach architektury komputerowych systemów informacyjno-wyszukiwawczych może mieć pozytywny wpływ na relewancję zwracanych wyników. LLM są w stanie realizować zadania z zakresu przetwarzania zapytań, indeksowania dokumentów oraz generowania złożonych odpowiedzi na pytania użytkowników. Stwierdzono również, że rozwiązania hybrydowe mają neutralny lub potencjalnie negatywny wpływ na rzetelność otrzymywanych informacji.

Abstrakt (EN)

A key issue in the information retrieval process is finding relevant documents based on user queries. This process requires search systems to have advanced natural language processing capabilities. In recent years, large language models (LLMs) have revolutionized the field of natural language processing, demonstrating exceptional abilities in understanding and generating text. This thesis highlights areas of synergy between large language models and traditional information retrieval systems, with particular emphasis on generative models and web search engines. The study shows that applying large language models within the architecture of information retrieval systems can have a positive impact on the relevance of returned results. LLMs are capable of performing tasks related to query processing, document indexing, and generating complex responses to user questions. It was also found that hybrid solutions have a neutral or potentially negative impact on the reliability of the obtained information.

Słowa kluczowe PL

informacja

wyszukiwanie informacji

system informacyjno-wyszukiwawczy

model językowy

Inny tytuł

Possibilities of using large language models (LLM) in the process of information retrieval in digital unstructured collections

Wydawca

Uniwersytet Warszawski

Data obrony

2024-09-26

Licencja otwartego dostępu

Dostęp zamknięty

Licencja

Możliwości wykorzystania dużych modeli językowych (LLM) w procesie wyszukiwania informacji w cyfrowych zbiorach nieustrukturyzowanych

Opcje

Abstrakt (PL)

Abstrakt (EN)