Praca doktorska
Ładowanie...
Miniatura
Licencja

FairUseKorzystanie z tego materiału możliwe jest zgodnie z właściwymi przepisami o dozwolonym użytku lub o innych wyjątkach przewidzianych w przepisach prawa. Korzystanie w szerszym zakresie wymaga uzyskania zgody uprawnionego.

Data analysis and modeling in human genomics

Autor
Sykulski, Maciej
Promotor
Gambin, Anna
Data publikacji
2014-11-14
Abstrakt (PL)

Genomika człowieka rozwija się szybko dzięki nowym dostępnym technologiom badania genomu, takim jak macierze aCGH (array Comparative Genomic Hybridization) lub nowoczesne metody sekwencjonowania genomu. Duże ilości danych pochodzące od pacjentów zawierają potencjalnie mnóstwo informacji o możliwych chorobach, czy skłonnościach ku takowym, o mechanizmach powstawania chorób genetycznych, także o mechanizmach ewolucji. Wydobycie takich informacji wymaga uważnego przetwarzania danych, konstrukcji właściwych modeli statystycznych w celu analizy i dyskryminacji pomiędzy stawianymi hipotezami. Podstawą używanych metod są algorytmy eksplorujące przestrzeń dopuszczonych modeli przy użyciu metod Monte Carlo Markov Chain, schematów optymalizacyjnych typu Expectation Maximization, testów statystycznych, jak i również adekwatnych heurystyk. W rozprawie zajmujemy się problematyką projektowania płytek aCGH, porównywania jakości tychże, oraz analizy wyników eksperymentów aCGH. Proponujemy opartą na Losowych Polach Markowowskich metodę odszumiania przestrzennego, która jednocześnie pozwala na wykrycie z danych aCGH CNVs (Copy Number Variants), segmentów w genomie pacjenta odpowiadających rearanżacjom. Przedstawiamy serwis bazodanowo-obliczeniowy, który powstał dla potrzeb diagnostyki, oraz wyniki biomedyczne otrzymane przy jego pomocy.

Abstrakt (EN)

Human genomics undergoes fast development thanks to new genome research technologies, such as aCGH (array Comparative Genomic Hybridization), or Next Generation Sequencing. Large amounts of data from patients potentially contain a lot of information about potential diseases, or susceptibility thereto, about mechanism of emergence of genetic diseases, and about mechanisms of evolution. Extracting such information requires careful data processing, constructing of proper statistical models, in order to analyze emerging hypotheses and discriminate between them. The basis for the used methods are algorithms which explore the space of possible models, with the use of Monte Carlo Markov Chain, or using optimizing schemes such as Expectation Maximization, as well as statistical tests and adequate heuristics. This dissertation concerns about issues of aCGH microarray design, comparison of quality of thereof. We propose a method of spatial denoising based on Markov Random Fields, which at the same time allows to recover from aCGH data CNVs (Copy Number Variants). Presented is the database and computational webservice, as well as biomedical results obtained with the use of it.

Słowa kluczowe PL
mikromacierze DNA
aCGH
CNV
choroby genetyczne
segmentacja
gaussowskie losowe pola markowowskie
bayesowskie modele graficzne
algorytm Expectation Maximization
wykrywanie przypadków odstających
sieć semantyczna
Inny tytuł
Analiza i modelowanie danych w genomice czlowieka
Data obrony
2015-04-13
Licencja otwartego dostępu
Dozwolony użytek