Refine
Document Type
- Bachelor Thesis (1)
- Master's Thesis (1)
Language
- German (2)
Keywords
- Datenintegration (2) (remove)
ETL Konzept zur Integration von unstrukturierten Quelldaten in ein bestehendes Data Warehouse
(2013)
Die vorliegende Arbeit wurde im Rahmen meines Studiums, Bachelor of Science in Wirtschaftsinformatik an der Hochschule Mittweida (FH) – Universal of Applied Sciences verfasst. Inhaltlich befasst sich diese Arbeit mit dem Thema des Data Warehousing sowie der Integration von unstrukturierten Daten. Das Hauptanliegen der Arbeit ist es, einen umfassenden Überblick über dieses Thema zu geben. Es soll insbesondere ein detailliertes Konzept erarbeitet werden, welches die Integration der unstrukturierten Daten im Praxisszenario erleichtert. Darüber hinaus beschäftigt sich diese Arbeit mit den erforderlichen Qualitätssicherungsmaßnahmen und Automatisierungsmöglichkeiten des ETL-Prozesses. Diese werden anhand eines realen Projektes im praktischen Teil der Arbeit veranschaulicht.
Durch verschiedene Industriezweige gelangen viele Chemiaklien in die Umwelt und lagern sich dort an. Dabei haben viele dieser Chemikalien für die Umwelt und den Menschen schädliche Nebenwirkungen. Diese sind einerseits von der Exposition der Substanzen und andernseits von Effekten auf den biologischen Kreislauf abhängig.
Um die genauen Auswirkungen dieser Verbindungen beurteilen zu können, ist es jedoch wichtig beide Bereiche zu betrachten. Im Rahmen dieser Arbeit wurde deswegen ein Ansatz entwickelt,mit dem die Daten der Exposition und die Daten der Auswirkungen mit einander verknüpft werden können. Dazu wurden zuerst Chemikalien für die Expositionsdaten und Chemikalien für die Wirkungsdaten bereitstehen aus öffentlich zugänglichen Datenbanken gesammelt. Mit Hilfe der Wirkungsdaten wurden anschließend Neuronale Netze trainiert. Es konnte gezeigt werden, dass mittels dieser Modelle die Auswirkungen auf Umwelt und Mensch für die Expositionschemikalien vorhergesagt werden kann.
Zudem wurden in mehreren Chemical Similarity Maps gezeigt, dass sich verschiedene Chemikaliencluster bilden, welche ähnliche chemische Eigenschaften besitzen. Dadurch könnte es möglich sein anhand der chemischen Ähnlichkeite bestimmte Wirkungsdaten für chemische Stoffe vorherzusagen.