Licencja
Potencjał serwisu Reddit do wykorzystania w badaniach naukowych
Abstrakt (PL)
Praca licencjacka przedstawia serwis internetowy Reddit (reddit.com) jako potencjalne narzędzie dla badań naukowych. W części pierwszej omawia stronę internetową i aplikację mobilną serwisu, przedstawiony tu został jego interfejs i nakreślona panująca na nim kultura, jak również algorytm sortowania jego treści. Zaprezentowane zostały metody pozyskania danych z serwisu poprzez jego Application Programming Interface (API), oraz służące do tego narzędzie zewnętrzne Reddit Pushshift, również oparte o API serwisu. Część druga pracy oparta jest na korpusie tekstów, opracowanym na podstawie metadanych publikacji naukowych, wykorzystujących Reddit jako narzędzie badawcze, umieszczonych w bazach Scopus i Web of Science między 2010 rokiem, a końcem stycznia 2023 roku. Zbadana została liczba publikacji w kolejnych latach (zaobserwowano stały wzrost), afiliacje autorów (widoczna tu dominacja ośrodków amerykańskich), popularność użycia tego narzędzia w publikacjach według czasopism oraz używane w nich słowa kluczowe. Część trzecia opisuje wykonany na potrzeby pracy, indukcyjny podział badanych publikacji na (niewymienione w metadanych Scopusa i Web of Science) dziedziny i dyscypliny naukowe oraz sposób wykorzystania serwisu Reddit pod względem metody badawczej, uzupełniając tym samym charakterystykę analizowanego korpusu tekstów.
Abstrakt (EN)
The thesis explores the internet platform Reddit (reddit.com) as a potential tool for scientific research. The first part discusses the website and mobile application, presenting their interface, the prevailing culture, and the content sorting algorithm. It delves into methods for data retrieval from the platform through its Application Programming Interface (API) and external tools like Reddit Pushshift, which also relies on the service's API. The second part of the thesis is based on a corpus of texts derived from metadata of scientific publications that utilized Reddit as a research tool. These publications are sourced from repositories Scopus and Web of Science between 2010 and the end of January 2023. The analysis covers the increasing number of publications over the years (with a consistent growth observed), the affiliations of authors (highlighting the dominance of American institutions), the popularity of Reddit as a research tool in publications across various journals, and the keywords used in these publications. The third part describes an inductive categorization of the studied publications into scientific fields and disciplines (not explicitly mentioned in the metadata of Scopus and Web of Science) and explores the utilization of Reddit in terms of research methodology. This section complements the characteristics of the analyzed corpus of texts, providing a comprehensive overview for the thesis.