Diversity and ecology of photosynthetic microbial eukaryotes in selected aquatic systems based on metabarcoding and metagenomic data

Uproszczony widok
dc.abstract.enMicrobial eukaryotes make up a significant part of the existing eukaryotic diversity. This diversity can be assessed on several levels: genetic diversity (e.g., sequence similarity and genome structure), morphological diversity (e.g., variation in size and shape) and functional capabilities within ecosystems. One of these functional groups are the eukaryotic members of the phytoplankton, which photosynthesize in aquatic ecosystems and thus contribute to global primary production. Among aquatic systems, freshwaters can be represented by diverse and dynamic communities that are shaped by abiotic and biotic factors and change over time (e.g., days, seasons, years), localization (e.g., sites in the same lakes, different lakes, lake systems), or depth (e.g., surface or aphotic zone). In addition, freshwater lakes are an excellent model to study the effects of climate change because their smaller volumes have a limited buffering capacity and are more vulnerable to temperature fluctuations than the oceans and seas. On the other hand, rising temperatures and longer dry seasons lead to lower water levels which, in combination with human pressure, lead to salinization of freshwater. Therefore, it is very important to study the bilateral transitions of microbial eukaryotes between marine and freshwater ecosystems as they pose a potential threat to native ecosystems. Understanding the ecology and diversity of microbial eukaryotes, and phytoplankton in particular, is critical to gaining insights into ongoing changes in freshwater ecosystems. The analysis of environmental DNA (eDNA) using high-throughput techniques - metagenomics and metabarcoding - enables the description of microbial composition independent of the scale of research (e.g., global scale or time series experiments). These techniques can be used to analyze species with similar morphology (so-called cryptic species) and to detect rare species regardless of their size. Therefore, these techniques can be an important complement to classical microscopic studies. However, we still lack tools and approaches that are specifically tailored to the analysis of phytoplankton. The aim of the study was to investigate the diversity and ecology of microbial communities in selected aquatic habitats, with a focus on eukaryotic communities in freshwater lakes. Specifically, I focused on 1) examining the global distribution of Euglenophyceae in marine systems and their bidirectional transitions with freshwater systems, 2) investigating the temporal changes of microbial eukaryotes in freshwater in relation to abiotic and biotic factors, and 3) evaluating the use of plastid genomes derived from extensive freshwater metagenomic data to elucidate diversity and ecology of phytoplankton. To achieve these goals, I utilized existing marine metabarcoding data (resources from Tara Oceans and Ocean Sampling Day public data) and performed sampling of Lake Roś, amplification of 18S rRNA and 16S rRNA gene fragments, and sequencing to obtain data from a dimictic freshwater lake. The gathered metabarcoding data were analyzed using existing approaches, including a tree-based approach (EPA algorithm) and data analyzes and visualizations, including machine-learning predictions (Random Forest). The long-term freshwater metagenomic data came from the LIMNOS project (unpublished data) and were analyzed using Tiara, a deep learning tool that I implemented to tackle complex metagenomics data. I then created a pipeline for plastid genome-resolved metagenomics which enabled the reconstruction of environmental plastid genomes (ptMAGs) and their placement in a phylogenomic and phylogenetic context using a reference database created for this study. The study of the distribution of members of the Euglenophyceae in marine systems revealed that the diversity of marine euglenids extends beyond known, typically marine groups. These results indicate several transitions between freshwater and marine systems. The study of the abundance of Euglenophyceae in marine ecosystems revealed that they are rather rare, but more abundant overall in nutrient-rich coastal waters than in the open ocean, consistent with patterns observed for their freshwater relatives abundant in eutrophic waters. Metabarcoding analysis of eukaryotic and prokaryotic communities in a dimictic freshwater lake during the ice-free season highlighted season-associated communities of microbial eukaryotes. Especially phytoplankton, form seasonal communities, whereas generalists are predominantly mixotrophic phytoplankton taxa such as cryptophytes and chrysophytes. The applied bioinformatic methods, in particular the Random Forest model, allowed the identification of taxa specific to certain seasons despite their low abundance at the level of ASVs. In addition, the temporal dynamics of prokaryotes can be linked to phytoplankton abundance and related with phytoplankton-derived organic matter (DOCp). The analysis of a large freshwater metagenomic data, consisting of over 500 million contigs in combination with a new bioinformatic approaches, allowed the recovery of over 500 plastidial metagenome-assembled genomes (ptMAGs), of which over 125 were nearly complete and could be assigned to all major lineages of the photosynthetic lineages of eukaryotes. These results have significantly expanded our knowledge of the genetic diversity of phytoplankton in freshwaters. The study of selected aspects of their diversity and ecology revealed novel lineage of pelagophytes previously known only from marine systems, an enormous diversity of photosynthetic Chrysophyceae in low pH environments and an overlooked genetic diversity of the picoplanktonic Mamiellophyceae group. In summary, this study demonstrates the potential of metabarcoding and metagenomics as effective tools to study the ecology and diversity of eukaryotic phytoplankton. These methods provide insights into transitions between systems, seasonal succession dynamics and community responses to environmental factors. In addition, plastid genome-resolved metagenomics has proven to be a valuable approach to study eukaryotic phytoplankton. Finally, the results obtained demonstrate the effectiveness of state-of-the-art data analysis methods, such as machine learning, together with the advantages of phylogenetics and phylogenomics for a better understanding of the diversity and ecology of microbial eukaryotes.
dc.abstract.plMikroorganizmy eukariotyczne (protisty) stanowią znaczną część istniejącej różnorodności biologicznej Eukaryota na naszej planecie. Ponadto samą różnorodność możemy rozważać na różnych poziomach, od różnorodności genetycznej (np. podobieństwo sekwencji genów czy całych genomów) poprzez różnorodność morfologiczną (np. zróżnicowanie rozmiarów i form) po dywersyfikację funkcji pełnionych w ekosystemach. Jedną z takich grup funkcjonalnych jest eukariotyczny fitoplankton, na który składają się fotosyntetyzujące mikroorganizmy eukariotyczne, które odgrywają kluczową rolę w globalnej produkcji pierwotnej. W ekosystemach wodnych, środowiska słodkowodne mogą być reprezentowane przez różnorodne i dynamicznie zmieniające się zespoły planktonowe, które kształtowane są przez czynniki abiotyczne oraz biotyczne. Zmienność zespołów może być obserwowana w czasie (np. dni, sezony, lata), i przestrzeni (np. w obrębie pojedynczego zbiornika wodnego, między różnymi zbiornikami), lub w profilu pionowym zbiornika (np. powierzchnia lub strefa afotyczna). Ponadto jeziora słodkowodne są doskonałym modelem do badania efektów zmian klimatycznych, ponieważ ich mniejsze objętości mają ograniczoną zdolność buforowania i w związku z tym są bardziej podatne na zmiany temperatury niż morza i oceany. Z drugiej strony, rosnące temperatury i wydłużające się okresy suszy prowadzą do niższych poziomów wód, które w połączeniu z presją antropogeniczną prowadzą do zasolenia wód słodkich. To powoduje, że badanie dwukierunkowych przejść mikroorganizmów eukariotycznych między ekosystemami morskimi i słodkowodnymi staje się istotnym problemem badawczym w kontekście potencjalnego zagrożenia inwazjami dla rodzimych ekosystemów. Zrozumienie ekologii oraz różnorodności mikroorganizmów eukariotycznych, w szczególności fitoplanktonu, jest kluczowe dla zrozumienia zmian zachodzących w ekosystemach wodnych. Analiza środowiskowego DNA (eDNA) z wykorzystaniem wysokoprzepustowych technik – metagenomiki oraz metabarkodingu umożliwia opisywanie składu mikroorganizmów niezależnie od skali prowadzonych badań (np. w skali globalnej lub w eksperymentach w szeregu czasowym), może służyć do analizy gatunków o zbliżonej morfologii (tzw. gatunki kryptyczne) oraz pozwala na detekcję gatunków rzadkich niezależnie od ich liczebności i wielkości. W związku z tym techniki te mogą być istotnym uzupełnieniem klasycznych badań mikroskopowych. Nadal jednak brakuje nam narzędzi bioinformatycznych oraz podejść do analizy tego typu danych dostosowanych specyficznie do analiz eukariotycznego fitoplanktonu. Celem moich badań było zbadanie różnorodności i ekologii społeczności mikroorganizmów w wybranych środowiskach wodnych, ze szczególnym uwzględnieniem mikroorganizmów eukariotycznych w jeziorach słodkowodnych. Skoncentrowałem się głównie na: 1) badaniu globalnego rozprzestrzenienia Euglenophyceae w systemach morskich i przejść między ekosystemami słodkowodnymi i morskimi w obrębie tej grupy, 2) badaniu zmian sezonowych mikroorganizmów eukariotycznych w wodach słodkich w zależności od czynników abiotycznych i biotycznych, oraz 3) ocenie możliwości wykorzystania genomów plastydowych, uzyskanych z dużych zbiorów słodkowodnych danych metagenomowych, w celu lepszego zrozumienia różnorodności i ekologii fitoplanktonu. Aby osiągnąć te cele, wykorzystałem istniejące zbiory danych metabarkodowych z mórz i oceanów (publicznie dostępne zasoby Tara Oceans i Ocean Sampling Day), a także zbierałem próby z jeziora Roś, przeprowadziłem amplifikację fragmentów genów 18S rRNA oraz 16S rRNA i sekwencjonowanie w celu uzyskania własnych metabarkodowych danych z jeziora dimiktycznego. Analiza zebranych danych została oparta o istniejące podejścia w tym bazujące na drzewach filogenetycznych (algorytm EPA) oraz przewidywania za pomocą algorytmów uczenia maszynowego (Lasy Losowe). Dane metagenomowe pochodzące z czterech jezior (część projektu LIMNOS) zostały przeanalizowane za pomocą programu Tiara, narzędzia głębokiego uczenia, które opracowałem do analizy złożonych danych metagenomowych. Następnie narzędzie to zostało wykorzystane jako element zaprojektowanej przeze mnie ścieżki analizy danych metagenomowych, której celem jest uzyskiwanie genomów plastydowych z metagenomów. Umożliwiło to rekonstrukcję środowiskowych genomów plastydów (ptMAGs), a następnie umieszczenie ich w kontekście filogenomicznym i filogenetycznym, z wykorzystaniem bazy referencyjnej przygotowanej na potrzeby tego projektu. Badanie rozmieszczenia oraz różnorodności reprezentantów glonów z grupy Euglenophyceae w ekosystemach morskich wykazało, że różnorodność morskich euglenin wykracza poza znane typowe grupy morskie, sugerując ich przejścia między systemami słodkowodnymi i morskimi. Badanie liczności morskich euglenin w środowisku wykazało, że są one raczej rzadkie, ale ogólnie bardziej liczne w bogatych w składniki odżywcze wodach przybrzeżnych niż na otwartym oceanie, czyli preferują warunki eutroficzne podobnie jak ich słodkowodni krewni. Analiza danych metabarkodowych zespołów eukariotycznych i prokariotycznych w jeziorze dimiktycznym, w szeregu czasowym od kwietnia do listopada, wykazała wysoką zmienność w czasie niektórych reprezentantów mikroorganizmów eukariotycznych, w tym gatunków stanowiących grupę producentów, podczas gdy grupy o niskiej zmienności w czasie należały głównie do miksotrofów (np. kryptofity i chrysofity). Zastosowane podejścia bioinformatyczne, w szczególności Lasy Losowe, pozwoliły na identyfikację taksonów specyficznych dla poszczególnych pór roku, pomimo ich małej liczebności na poziomie ASV. Dodatkowo, obserwowana sezonowa dynamika prokariotów może być powiązana z materią organiczną pochodzącą z fitoplanktonu (DOCp). Wielkoskalowa analiza danych metagenomowych z wód słodkich, składających się z ponad 500 milionów kontigów, pozwoliła na uzyskanie ponad 500 genomów plastydowych, z których ponad 125 było niemal kompletnych i zostały przypisane do wszystkich głównych linii fotosyntetycznych eukariotów. Umożliwiło to znaczne poszerzenie naszej wiedzy na temat różnorodności genetycznej fitoplanktonu wód słodkich. Badanie wybranych aspektów ich różnorodności i ekologii ujawniło nową linię pelagofitów, znanych dotychczas tylko z systemów morskich, ogromną różnorodność chryzofitów, sugerując ich adaptację do warunków środowiskowych w tym niskiego pH, a także ujawniła różnorodność genetyczną w obrębie grupy pikoplanktonu -Mamiellophyceae. Podsumowując możemy stwierdzić, że badania metabarkodowe oraz metagenomowe są doskonałym sposobem analizy ekologii i różnorodności fitoplanktonu. Umożliwiają one wykrywanie przejść między systemami, analizę sukcesji sezonowej oraz badanie odpowiedzi mikroorganizmów na czynniki środowiskowe. Co więcej, metagenomika genomów plastydowych może być wykorzystana do odpowiedzi na kolejne, liczne pytania dotyczące ekologii fitoplanktonu. Przeprowadzone przeze mnie badania demonstrują również skuteczność nowoczesnych podejść do analizy danych, w tym uczenia maszynowego oraz użyteczność filogenetyki i filogenomiki w badaniach ekologicznych.
dc.affiliationUniwersytet Warszawski
dc.affiliation.departmentWydział Biologii
dc.contributor.authorKarlicki, Michał
dc.date.accessioned2024-10-29T09:37:39Z
dc.date.available2024-10-29T09:37:39Z
dc.date.defence2024-11-07
dc.date.issued2024-10-29
dc.date.submitted2024-06-03
dc.description.promoterKarnkowska, Anna
dc.description.reviewerGołdyn, Ryszard
dc.description.reviewerŁabaj, Paweł
dc.description.reviewerMackiewicz, Paweł
dc.description.versionfinal_author
dc.identifier.orcid0000-0002-7952-6288
dc.identifier.urihttps://repozytorium.uw.edu.pl//handle/item/160570
dc.languageen
dc.language.otherpl
dc.rightsCC-BY
dc.subject.enbiodiversity
dc.subject.enecology
dc.subject.enfreshwaters
dc.subject.enlakes
dc.subject.enmachine-learning
dc.subject.enmetabarcoding
dc.subject.enmetagenomics
dc.subject.enmicrobial eukaryotes
dc.subject.enphytoplankton
dc.subject.enplastid genomes
dc.subject.enseasonal dynamics
dc.subject.pldynamika sezonowa
dc.subject.plekologia
dc.subject.plfitoplankton
dc.subject.plgenomy plastydowe
dc.subject.pljeziora
dc.subject.plmetabarkoding
dc.subject.plmetagenomika
dc.subject.plmikroorganizmy eukariotyczne
dc.subject.plróżnorodność biologiczna
dc.subject.pluczenie maszynowe
dc.subject.plwody słodkie
dc.titleDiversity and ecology of photosynthetic microbial eukaryotes in selected aquatic systems based on metabarcoding and metagenomic data
dc.title.alternativeEkologia i różnorodność fotosyntetyzujących mikroorganizmów eukariotycznych wybranych środowisk wodnych w oparciu o dane metabarkodowe i metagenomowe
dc.typeDoctoralThesis
dspace.entity.typePublication