Licencja
Application of computational biophysics and bioinformatics to multiscale biological problems
Abstrakt (PL)
Moja praca doktorska przedstawia zastosowania bioinformatyki oraz biofizyki obliczeniowej w wieloskalowych problemach biologicznych. W pierwszej części doktoratu zastosowałem narzędzia bioinformatyki w badaniu metylacji u S. cerevisiae. W obrębie tej pracy przeprowadziłem obszerną klasyfikację, pod kątem struktury oraz funkcji, wszystkich metylotransferaz (MTaz) kodowanych w genomie tego drożdża. Wykazałem, stosując metody detekcji dalekiej homologii, iż metylotransferom S. cerevisiae składa się z 86 MTaz, pośród nich 53 MTazy zostały już wcześniej eksperymentalnie scharakteryzowane, natomiast dla pozostałych 33 wciąż nie mamy potwierdzonej aktywności metylotransferazowej. Przeprowadzona przeze mnie klasyfikacja strukturalna domeny katalitycznej pokazała, iż metylotransferazy mogą przyjmować 9 różnych zwojów, przy czym dominującym jest zwój Rossmann-like. Ponadto przeanalizowałem architekturę domenową tych białek i zidentyfikowałem kilka nowych kontekstów domenowych. W swojej pracy wskazałem również, iż większość genów MTaz podlega cyklicznej ekspresji podczas drożdżowego cyklu metabolicznego (yeast metabolic cycle). Wykorzystałem tę obserwację, uzupełniając ją danymi o punkcie izoelektrycznym, rodzaju zwoju i lokalizacji komórkowej, do zaproponowania nowej metody przewidywania specyficzności substratowej. Metoda ta, działająca w oparciu o drzewa decyzyjne, pozwoliła mi na przewidzenie specyficzności substratowej dla 24 z 33 potencjalnych MTaz. Moje przewidywania zostały już potwierdzone dla ośmiu z dwunastu do tej pory zweryfikowanych eksperymentalnie nowych MTaz. Ponadto zaproponowany przeze mnie algorytm może być zastosowany do badania kolejnych rodzin białkowych. Podsumowując, wykazałem iż u S. cerevisiae metylacja jest przeprowadzana przez 35 MTaz RNA, 31 MTaz białkowych, dziewięć MTaz małych cząsteczek, trzy MTazy lipidów a także osiem MTaz, dla których wciąż nie znamy specyficzności substratowej. W drugiej części doktoratu zastosowałem narzędzia biofizyki obliczeniowej do opisu oddziaływania białko-białko w przypadku ubikwityny. Przeprowadziłem dokładną analizę strukturalną zbioru konformacji związanej jak i wolnej ubikwityny oraz zbadałem zakres stosowalności modelu wymuszonego dopasowania (induced fit), następującego po selekcji konformacyjnej (conformational selection), w opisie procesu wiązania ubikwityny. W mojej pracy wykazałem, iż w otoczeniu miejsca wiązania liganda do ubikwityny zachodzą zmiany konformacyjne, które są większe w porównaniu do średnich zmian strukturalnych w obrębie całego białka. Następnie pokazałem, iż te lokalne zmiany wyjaśnia model wymuszonego dopasowania a ich zakres ich jest porównywalna do zmian wywołanych selekcją konformacyjną. Podsumowując, w mojej pracy zaproponowałem nowy model opisujący oddziaływanie ubikwityny z ligandami białkowymi, model ten łączy selekcje konformacyjną z następującym po niej wymuszonym dopasowaniem zachodzącym w obrębie miejsca wiązania. Ponadto przedstawiłem nowy sposób badania udziału wymuszonego dopasowania i selekcji konformacyjne w opisie oddziaływania białko-białko.
Abstrakt (EN)
In my thesis I presented two applications of bioinformatics and computational biophysics in multiscale biological problems. The first project aimed to provide insights into enzymatic methylation in S. cerevisiae using the bioinformatic approach. I conducted a comprehensive structural and functional classification of all the methyltransferases encoded in its genome. Using distant homology detection and fold recognition, I found that the S. cerevisiae methyltransferome comprises 86 MTases (53 well-known and 33 putative with unknown substrate specificity). Structural classification of their catalytic domains shows that these enzymes may adopt nine different folds, the most common being the Rossmann-like. I also analyzed the domain architecture of these proteins and identified several new domain contexts. I found that the majority of MTase genes are periodically expressed during yeast metabolic cycle. I used this finding, together with the calculated isoelectric point, fold assignment and cellular localization, to develop a novel method for predicting substrate specificity. Moreover, I predicted the general substrate for 24 of 33 putative MTases using this approach. My predictions were correct for eight proteins out of twelve putative MTases already experimentally verified. What is important, my methodology can be further extended to the other protein families. Finally, I showed that, in S. cerevisiae, methylation is carried out by 35 RNA MTases, 31 protein MTases, nine small molecule MTases, three lipid MTases and eight MTases with unknown substrate specificity. In the second project I applied the computational biophysics approach to describe protein-protein interactions in ubiquitin recognition. I performed an extensive structural analysis of a large set of bound and unbound ubiquitin conformers, and studied the level of residual induced fit after conformational selection in the binding process. I showed that the region surrounding the binding site in ubiquitin undergoes conformational changes that are significantly more pronounced compared with the whole molecule on the average. I demonstrated that these induced fit structural adjustments are comparable in magnitude to the conformational selection. Moreover, I demonstrated that this picture is preserved in other structural ensembles based on the same experimental data. Finally I proposed a model of ubiquitin binding, which blends conformational selection with subsequent induced fit, and provides a quantitative measure of their respective contributions.