Fotografia w zasobach sieciowych: opis i wyszukiwanie

Autor
Stępień, Kamil
Promotor
Woźniak-Kasperek, Jadwiga
Kotuła, Sebastian
Data publikacji
2018-06-14
Abstrakt (PL)

Rozprawa składa się z czterech głównych rozdziałów, w których omówiono funkcjonowanie obrazów cyfrowych w przestrzeni współczesnej sieci WWW. Rozdział pierwszy skupia się na przedstawieniu najważniejszych koncepcji naukowych, społecznych i kulturowych, które podkreślają znaczenie obrazów, zwłaszcza fotografii, w życiu człowieka, oraz ich specyfikę. Przedstawiono znaczenie fotografii jako dokumentu, dzieła sztuki, materiału naukowo-badawczego. W rozdziale drugim zaprezentowano sposoby analizy i interpretacji obrazów. Przedstawiono fotografię jako komunikat o wielu warstwach do odczytania. Wyjaśniono definicje widzenia, patrzenia i spoglądania oraz ich rolę w obcowaniu z dokumentami wizualnymi. Pokazano relacje pomiędzy socjologią wizualną a kulturą wizualną. Scharakteryzowano metody: kompozycyjną, semiologiczną i psychoanalizę. Opisano metodę analizy treści zawartości obrazów. Zaprezentowano i scharakteryzowano rodzaje odbiorców obrazów (publiczności). Wskazano na specjalne metody badawcze bazujące na psychologii widzenia i okulocentryzmie. W rozdziale trzecim uwaga została skupiona na strategiach wyszukiwania dokumentów wizualnych, zwłaszcza fotografii. Zdefiniowano istotę i metody wyszukiwania dokumentów wizualnych. Przedstawiono strategie wyszukiwawcze połączone z profilowaniem behawioralnym i personalizacją wyników wyszukiwawczych dla użytkownika końcowego oraz scharakteryzowano sylwetkę współczesnego widza internetowego, uwzględniając jego potrzeby i zachowania informacyjne. Podjęto także próbę zdefiniowania obrazu, jego cech i reprezentacji. Podkreślono złożoną (warstwową) budowę dokumentów wizualnych – obcując z dokumentami wizualnymi (zarówno analogowymi, jak i cyfrowymi), należy zwrócić uwagę na zawartość (treść), cechy fizyczne (nośnik), a także subiektywną interpretację, połączoną często z dokumentami towarzyszącymi i wiedzą widza (odbiorcy). W omawianym rozdziale przedstawiono również sposoby automatycznego przetwarzania obrazów (CBIR), inżynierię wizualną i graficzne deskryptory obrazu, takie jak: kolor, wzór i kształt. W rozdziale czwartym przeanalizowano na przykładach schematy metadanych stosowane do opisu dokumentów wizualnych w bibliotekach, archiwach i muzeach. Przedstawiono profesjonalne podejście w indeksowaniu i katalogowaniu dokumentów, a także skonfrontowano je z oddolnymi, kolektywnymi (równoprawnymi) inicjatywami dystrybuowania treści przez użytkowników sieci WWW. Skupiono się na standardach opisów, przedstawiono polskie dokumenty i normy, na których opiera się tworzenie profesjonalnych opisów dokumentów wizualnych. Zaprezentowano rodzaje i standardy metadanych stworzonych typowo dla identyfikacji obrazów, a także pokazano przykłady adaptacji schematów ogólnych stosowanych w archiwach czy bibliotekach. Wskazano na różnice w odczytaniu i zrozumieniu przekazu wizualnego przez człowieka oraz oprogramowanie komputerowe. Opisano także problem luki semantycznej. Na koniec zaprezentowano autorski klucz kategoryzacyjny, wypracowany na podstawie analizy dotychczasowych schematów metadanych przypisanych obrazom.

Abstrakt (EN)

The dissertation consists of four main chapters discussing the functioning of digital images in the contemporary space of World Wide Web (WWW). The first chapter focuses on presenting the most important scientific, social and cultural ideas emphasizing the significance of images, especially photographs, in human life, as well as their specificity. The meaning of a photograph as a document, work of art. and scientific research material was presented. The matter of visual document message strength was addressed, including photographs, as well as the manner of organizing them and the fact that photography records reality in an extremely detailed way, the history of photography was described in the context of the development of new research methods in science. The second chapter concerns the ways of analyzing and interpreting images. Photography was shown as a message with many layers to decipher. Definitions of seeing, looking and glancing were explained, as well as their role in dealing with visual documents. The relationship between visual sociology and visual culture was shown. The following methods were characterized: compositional, semiological and psychoanalysis. Image contents analysis was described. Types of image addressees (audience) were presented and characterized. Special research methods were indicated, based on psychology of seeing and oculocentrism. The third chapter focuses on visual document retrieving strategies, especially concerning photographs. The significance and methods used for finding visual documents were defined. Retrieving strategies were presented, combined with behavioral profiling and retrieval results personalization for the end user and the silhouette of the contemporary Internet viewer, considering their information needs and behaviors. An attempt was also made at defining an image, its features and representations. The complex (layered) structure of visual documents was emphasized – when dealing with visual documents (both analog and digital), attention should be paid to the contents, physical features (carrier), as well as subjective interpretation, frequently connected with accompanying documents and the viewer’s (addressee’s) knowledge. The chapter under discussion also presents the ways of automatic image processing (CBIR), visual engineering and graphic image descriptors, such as color, pattern and shape. In the fourth chapter the author analyzed on certain examples the meta-data schemes used for describing visual documents in libraries, archives and museums. The professional approach to indexing and cataloging documents was presented, and confronted with grass-roots, collective (equal) initiatives of distributing contents by web users. We focused on description standards. Polish documents and norms were presented on which creating professional descriptions of visual documents are based. We presented kinds and standards of meta-data, created typically for image identification, as well as examples of adapting general schemes used in archives or libraries. Differences were indicated in deciphering and understanding the visual message by humans and by a computer software. The problem of semantic gap was also described. Finally, the author’s original categorization keywas presented, which was developed on the basis of the analysis of hitherto meta-data schemes attributed to images.

Słowa kluczowe PL
fotografia cyfrowa
wyszukiwanie odwrotne
wyszukiwanie obrazem
wyszukiwanie obrazów według zawartości
język obrazów
CBIR
uczenie maszynowe
sztuczna inteligencja
rzeczywistość rozszerzona
komunikacja wizualna
narzędzia humanistyki cyfrowej
Inny tytuł
Photography in Web Resources: Description and Retrieval
Data obrony
2018-06-27
Licencja otwartego dostępu
Dostęp zamknięty