Refine
Document Type
- Bachelor Thesis (5)
Language
- German (5) (remove)
Keywords
- Bioinformatik (5) (remove)
Institute
- 03 Mathematik / Naturwissenschaften / Informatik (5) (remove)
Ziel der Bachelorarbeit ist es, ein Programm zur Auswertung von bestimmten Genetikexperimenten zu entwickeln. Durch die Automatisierung der Auswertung solcher Experimente wird die Forschung vorangetrieben und die Chance auf Fehler wird dezimiert. Um die Arbeit für alle verständlich zu machen, werden zu Beginn die biologischen Hintergründe, die der Arbeit zu Grunde liegen, erläutert, um danach auf die aus den Experimenten gewonnenen Dateien einzugehen. Anschließend wird das Konzept sowie die Realisierung näher betrachtet. Zum Schluß erfolgt eine Zusammenfassung und ein Ausblick auf mögliche Programmerweiterungen.
EIIa in Ferrovum sp. JA12
(2012)
Für die Analyse und Visualisierung von Genexpressionsdaten existiert ein Programm der Firma Biotype® Diagnostic GmbH: der XpressionXplorer. Dieser liest normalisierte Genexpressionsdaten des "GeneChip® Human Genome U133 Plus 2.0 Array" von Affymetrix ein, die von den Datenbanken GEO und ArrayExpress abstammen. Die Genexpressionsdaten stellen eine zentrale Datenstruktur dar, welche sich abstrahiert als Tabelle, mit einer fixen Anzahl von 54.675 Zeilen und einer variablen Anzahl von über 9.000 Spalten, vorstellen lässt. Jede Zeile der Tabelle repräsentiert ein Probeset auf dem GeneChip® und jede Spalte ein Genexpressionsprofil aus einem Microarray-Experiment. Die vorliegende Arbeit beschäftigt sich mit der Weiterentwicklung einer Programmkomponente des XpressionXplorers. Die Programmkomponente hat die Bezeichnung "Differential Expression" und dient zur Entdeckung von Genen, die sich als Biomarker, z. B. von Tumorerkrankungen, eignen. Diese Programmkomponente sollte durch Einbinden einer neuen grafischen Komponente - der VirtualTreeview - erweitertund verbessert werden. Die hauptsächlichen Vorteile dieser VirtualTreeview sind die kurzen Aktualisierungszeiten, die zusätzliche Darstellung in Spalten und die Möglichkeit des interaktiven Bedienens durch die Benutzer.
In diesem Projekt stand die Steigerung der Effizienz bei der Auswertung von
Next-Generation-Sequencing-Daten aus Peptid-Phage-Display-Experimenten
im Vordergrund. Das Ziel war das Finden von Sequenz-Erweiterungen zu
bisher gefundenen Epi- und Mimotopen. Die Ergebnisse des vorangegangenen
Projektes wurden geteilt, um die Auswertungskriterien vor und nach den
Software-Veränderungen vergleichen zu können. Dabei sollte die Analyse alle
möglichen Erweiterungen in den bisher gefundenen möglichen Epitopen
untersuchen. Dazu wurden zwei Aufgaben realisiert. Das erste Projekt diente der Bearbeitung der NGS-Datensätze direkt nach der Sequenzierung und
anschließend in der zweiten Aufgabe wurde ein Tool verbessert, dass bei der
Analyse der Datensätze unterstützt.
Bei den Verbesserungen ging es nicht nur um die reine Zeitersparnis, sondern
auch um die Anwenderfreundlichkeit.
Membranproteine sind essentiell für viele lebenswichtige Prozesse in allen Organismen. Es ist hilfreich ihre Struktur aufzuklären, um ihre Funktionen und die diesen zu Grunde liegenden Mechanismen zu verstehen. Untersuchungen haben gezeigt, dass es kurze Motive gibt, die in a -helikalen transmembranen Proteinen allgegenwärtig sind. Es wird vermutet, dass diese Sequenzabschnitte elementare Eigenschaften besitzen, die die Stabilität und eventuell auch die Funktionen dieser Proteine ausmachen. In dieser Arbeit wurden die Interaktionen und die Beschaffenheit dieser Motive untersucht. Auf der Grundlage verschiedener Datenbanken konnte ein Informationsalmanach erstellt werden, der relevante Informationen zu jedem Motiv enthält. Mit einer Applikation können diese Daten visualisiert werden. Die so generierte Darstellung ist eine Möglichkeit, Proteine auf Grundlage von Motiven genauer zu analysieren. Eine Untersuchung von Motiven aus verschiedenen Proteinfamilien erbrachte weitere Einblicke. Es hat sich gezeigt, dass es Motive gibt, die vorrangig für die Aufrechterhaltung der Struktur verantwortlich sind und solche, die für eine Funktion wichtig erscheinen. Es existieren Motive, die in allen Proteinfamilien vorkommen, jedoch in jeder eine veränderte Zusammensetzung zeigen. Trotzdem scheinen sie in allen Familien die gleichen Auswirkungen zu haben. Andere Motive sind nur in bestimmten Proteinfamilien hoch konserviert und wahrscheinlich für eine Funktion spezifisch. Auf dieser Grundlage wurde eine Methode entwickelt, die einen Vergleich zwischen den Familien ermöglicht.