OPUS


The Xaa-Proline cis/trans Isomerization in Globular Proteins : Extraction of Structural Features and the Development of a Support Vector Machine Based Prediction Tool

  • In this work a new method for the prediction of the Xaa-proline (where Xaa is any amino acid) cis/trans isomerization was investigated. By extraction of twelve structural features (real secondary structure, inside/outside classification, properties of the environment around proline and proline itself) a support vector machine (SVM) based prediction approach was evolved. The Java software Xaa-PIPT for structural feature extraction was developed. Based on 4397 (2199 cis and 2198 trans) prolines extracted from non-redundant, globular proteins a classifier was trained using the radial basis function (RBF) kernel. In ten-fold cross-validation it achieved an accuracy of 70.0478 % and a Matthews correlation coefficient (MCC) of 0.4223, a sensitivity of 0.5433 and a specificity of 0.8576. Based on this classifier a lightweight and easy-to-use Java software tool, called m Xaa-PIPT, for the prediction of the Xaa-proline cis/trans isomerization was devel-oped. It was shown that there are correlations between the proline surrounding environment and the isomerization state. m Xaa-PIPT can be used for the evaluation of low-resolution protein structures and theoretical models to improve their quality by the prediction of the Xaa-proline isomerization.
  • In dieser Arbeit wurde eine Methode zur Vorhersage der Xaa-Prolin cis/trans Isomerie (Xaa ist eine beliebige Aminosäure) untersucht. Durch die Extraktion von zwölf strukturellen Merkmalen (echte Sekundärstruktur, innen/außen Klassifizierung von Prolin, Eigenschaften der Umgebung um Prolin und von Prolin selbst) wurde eine Support Vector Machine (SVM) als Methode zur Vorhersage umgesetzt. Die Java Software Xaa-PIPT wurde zur Extraktion der strukturellen Merkmale entwickelt. Basierend auf 4397 (2199 cis und 2198 trans) Prolinen aus nicht redundanten, globulären Proteinen wurde ein Klassifikator mit Hilfe des radialen Basisfunktion (RBF) Kernels trainiert. In zehnfacher Kreuzvalidierung erzielte dieser eine Genauigkeit von 70,0478 % und einen Matthews Korrelationskoeffizienten (MCC) von 0,4223. Außerdem wurde eine Sensitivität von 0,5433 und eine Spezifität von 0,8576 erreicht. Basierend auf diesem Klassifikator wurde eine leichtgewichtige und benutzerfreundliche Software in Java entwickelt (m Xaa-PIPT), um die cis/trans Isomerie von Prolin vorherzusagen. Es wurde gezeigt, dass Korrelationen zwischen der räumlichen Umgebung von Prolin und der Isomerie bestehen. m Xaa-PIPT kann für die Evaluierung von niedrig aufgelösten Proteinstrukturen und theoretischen Modellen verwendet werden, um deren Qualität durch die Vorhersage der Xaa-Prolin Isomerie zu verbessern.

Download full text files

Export metadata

  • Export Bibtex
  • Export RIS

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Florian Kaiser
URN:urn:nbn:de:bsz:mit1-opus-24449
Document Type:Bachelor Thesis
Language:English
Year of Completion:2012
Publishing Institution:Hochschule Mittweida
Release Date:2012/11/27
GND Keyword:Proteine; Sphäroproteine; Support-Vektor-Maschine; cis-trans-Isomerie
Institutes:03 Mathematik / Naturwissenschaften / Informatik
Access Rights:Frei zugänglich
Licence (German):License LogoEs gilt das UrhG

$Rev: 13581 $