Investigation of mirror/native structures in biomolecules
Native oder gespiegelte Strukturen in Biomolekülen
- In bioinformatics one important task is to distinguish between native and mirror protein models based on the structural information. This information can be obtained from the atomic coordinates of the protein backbone. This thesis tackles the problem of distinction of these conformations, looking at the statistics of the dihedral angles’ distribution regarding the protein backbone. This distribution is visualized in Ramachandran plots. By means of an interpretable machine learning classification method – Generalized Matrix Learning Vector Quantization – we are able to distinguish between native and mirror protein models with high accuracy. Further, the classifier model supplies supplementary information on the important distributional regions for distinction, like α-helices and β-strands.
- Eine wichtige Aufgabenstellung der Bioinformatik ist es, zwischen nativen und gespiegelten Proteinmodellen (Konformationen) aufgrund von struktureller Information zu unterscheiden. Diese Information kann von den Atomkoordinaten des Proteinrückgrates erhalten werden. Diese Arbeit befasst sich mit der Problematik der Konformationsunterscheidung, indem die Verteilung der dihedralen Winkel des Proteinrückgrates statistisch betrachtet wird. Diese Verteilung wird in Ramachandran-Plots dargestellt. Mithilfe einer interpretierbaren Klassifizierungsmethode des maschinellen Lernens –Generalized Matrix Learning Vector Quantization – kann zwischen nativen und gespiegelten Proteinmodellen mit hoher Genauigkeit unterschieden werden. Des Weiteren liefert das Klassifikationsmodell zusätzliche Informationen zu den für die Unterscheidung relevanten Winkelverteilungen, wie α -Helices und β-Faltblättern.
Author: | Julia Abel |
---|---|
Advisor: | Thomas Villmann, Marika Kaden |
Document Type: | Master's Thesis |
Language: | English |
Year of Completion: | 2020 |
Granting Institution: | Hochschule Mittweida |
Release Date: | 2022/01/13 |
GND Keyword: | Bioinformatik |
Institutes: | Angewandte Computer‐ und Biowissenschaften |
DDC classes: | 570.285 Bioinformatik |
Open Access: | Frei zugänglich |
Licence (German): | Urheberrechtlich geschützt |