Doctoral thesis
Loading...
Thumbnail Image
License

FairUseUsing this material is possible in accordance with the relevant provisions of fair use or other exceptions provided by law. Other use requires the consent of the holder.

Computational analysis of cancer Next-Generation Sequencing data

Author
Bergmann, Ewa
Promoter
Bartnik, Ewa
Publication date
2017-01-24
Abstract (PL)

Sekwencjonowanie Nowej Generacji (NGS, ang. Next Generation Sequencing) stało się jedną z podstawowych technik badania i diagnostyki molekularnej chorób nowotworowych. Pozwala ono nie tylko na lepsze rozumienie powstawania i ewolucji nowotworów, ale także na dobór spersonalizowanych metod leczenia. Pomimo istnienia rozlicznych zaawansowanych narzędzi bioinformatycznych precyzyjna analiza i interpretacja danych wciąż są bardzo trudne. Mutacje somatyczne, w przeciwieństwie do mutacji germinalnych, występują jedynie w niektórych komórkach organizmu, akumulują się w ciągu trwania życia oraz nie są dziedziczone z pokolenia na pokolenie. Odgrywają one szczególnie ważną rolę w transformacji nowotworowej. Ich czuła detekcja jest zatem niezmiernie istotna w bioinformatycznej analizie DNA nowotworów. Aby wykryć mutacje somatyczne najczęściej używa się dwóch próbek pochodzących od tego samego pacjenta. Jedną jest zazwyczaj wycinek nowotworu pobrany w czasie operacji lub biopsji (w przypadku guzów litych), drugą stanowi próbka niezawierająca komórek nowotworowych - bardzo często wykorzystywana jest krew obwodowa pacjenta. Następnie z obu próbek izolowany jest DNA, który w dalszym kroku jest sekwencjonowany. Wykrywanie mutacji somatycznych polega na detekcji zmian obecnych jedynie w DNA nowotworowym (nieobecnych w próbce kontrolnej). Do głównych przyczyn, z powodu których wykrywanie mutacji somatycznych jest trudne należą cechy nieodłącznie związane z charakterystyką nowotworów: niska zawartość DNA nowotworowego w próbce (ang. tumor purity), ploidia nowotworu (ang. tumor ploidy) oraz heterogenność nowotworu (ang. tumor heterogeneity). Do tego nierzadko dochodzą problemy z jakością analizowanego materiału uwarunkowane przechowywaniem i obróbką próbki, oraz samym sekwencjonowaniem wyizolowanego DNA.Przedmiotem rozprawy jest przedstawienie problemów i zaproponowanie rozwiązań dotyczących wybranych aspektów bioinformatycznej analizy nowotworowych sekwencji DNA. Na podstawie opublikowanych przeze mnie prac opisane zostaną zagadnienia: 1) wykrywania kontaminacji próbki nowotworowej oraz kontrolnej obcym DNA oraz zgodności genetycznej obu próbek 2) zastosowania programu Scalpel do detekcji somatycznych delecji i insercji oraz 3) analizy porównawczej profili genetycznych mysich modeli ostrej białaczki szpikowej (AML, ang. acute myeloid leukemia) oraz pacjentów chorych na ostrą białaczkę szpikową w celu identyfikacji mutacji odpowiedzialnych za rozwój nowotworu.

Abstract (EN)

Next Generation Sequencing (NGS) quickly became one of the most fundamental techniques used in research and molecular diagnostics of cancer. It allows not only for better understanding of tumor initiation and evolution, but also for selection of personalized treatment options. However, despite the existence of multiple advanced bioinformatics tools, precise data analysis and interpretation still poses many challenges.In contrast to germline mutations, somatic mutations occur only in a subset of cells, accumulate during the lifetime and are not passed to the next generations. They play an essential role in carcinogenesis, and their sensitive detection is therefore crucial in the bioinformatics analysis of cancer data. In order to detect somatic mutations, two samples from one patient are typically needed. One sample is taken from the cancer site during surgery or biopsy, the other is intended to represent normal (non-cancerous) tissue, and most often is derived from the patient’s peripheral blood. In the next step, DNA from the two samples is extracted and sequenced. Detection of somatic alterations relies on identifying changes present in the tumor sample, but absent in the matched normal sample. Accurate identification of somatic mutations is extremely difficult due to challenges intrinsically associated with characteristics of tumor samples: tumor purity, tumor ploidy and tumor heterogeneity. Additional problems may be caused by the low quality of the genetic material due to inappropriate storage, sample preparation and sequencing of the isolated DNA. This thesis attempts to highlight challenges and offer solutions to the selected aspects of bioinformatics analysis of cancer sequencing data. Based on the published manuscripts that form part of this thesis, the following problems will be discussed: 1) detection of cross-individual DNA sample contamination and verification of genetic concordance between tumor and control samples 2) use of the algorithm Scalpel to identify somatic deletions and insertions 3) comparative analysis of mutational profiles of acute myeloid leukemia (AML) mouse models and patients with AML to identify new driver mutations of AML.

Keywords EN
bioinformatics
cancer
Next-Generation Sequencing
data analysis
personalized medicine
Alternative Title
Computational analysis of cancer Next-Generation Sequencing data
Defence date
2017-05-29
Open access license
Fair use