Refine
Document Type
- Bachelor Thesis (3)
- Diploma Thesis (2)
- Master's Thesis (1)
Language
- German (6) (remove)
Keywords
- Cluster-Analyse (6) (remove)
Durch die zunehmende Nutzung mobiler Endgeräte fallen im alltäglichen Leben zahlreiche personenbezogene Daten an. Zu diesen Daten gehören unter anderem auch GPS-Positionen, die von handelsüblichen Smartphones erhoben werden. Besonders Android-Geräte sammeln eine große Menge an Positionsdaten, die für verschiedene Wissenschafts-Domänen, wie beispielsweise Medizin oder Forensik, eine Rolle spielen. Für verschiedene Anwendungsfälle kann eine Aggregation der einzelnen GPS-Positionen zu Orten und verbindenden Strecken relevant sein.
Ziel der Arbeit ist die Entwicklung eines Algorithmus zur Aggregation von GPS-Standorten zu Orten, deren Besuchen und Verbindungen. Nach Implementierung des Algorithmus wurde dieser in eine Java-Applikation eingebettet, die unter anderem der Visualisierung der erzielten Ergebnisse dient. Für die Evaluation des Algorithmus wurden über einen Zeitraum von zwei Monaten Standortdaten mit Hilfe eines Android-Smartphones erhoben, welche unter Verwendung des implementierten Algorithmus ausgewertet wurden. Die Evaluation resultierte in einem Parameterset, welches sich für die Auswertung des vorliegenden Testdatensatzes als geeignet herausstellte. Das Ergebnis der Arbeit ist ein funktionstüchtiger Algorithmus, der vielfältige Anwendungsmöglichkeiten aufweist und dessen Erweiterung ein hohes Potenzial für Folgeprojekte bietet.
In der vorliegenden Arbeit werden strukturelle und funktionelle Proteinmotive hinsichtlich ihrer energetischen Charakteristika untersucht und nach energetischen Abständen über hierarchische Clusterverfahren geclustert. Dabei sollen Gesetzmäßigkeiten offen gelegt werden, die sich über die Abstraktionsebenen der Sequenz, Struktur, Funktion und der Energie erstrecken.
Es ist möglich, Graphen und Netzwerke durch Bewertung der Kanten mit Hilfe des Zentralitätsindizes Betweenness in Cluster zu zerlegen. Die Berechnung der Betweennesswerte für jede Kante eines betrachteten Graphen benötigt eine Zeit von O(n2m) für m >> n. In dieser Arbeit wird eine schnellere Methode mit einer Zeitkomplexität von O(nm) für die Berechnung eines Betweenness Rankings nach Newman und unabhängig nach Brandes vorgestellt und implementiert. Es wird ein Clusteralgorithmus nach Newman und Girvan auf Basis des Index Kanten-Betweenness und mit einer Laufzeit von O(nm2) vorgestellt und es werden verschiedene Graphen damit geclustert. Die Arbeit ist restringiert auf schlichte, ungerichtete Graphen.
Diese Diplomarbeit handelt von der IT-Benutzersegmentierung auf Basis der Marktsegmentierung. Das Ziel der Ausarbeitung ist die Ermittlung der optimalen Anzahl von Benutzersegmenten am Beispiel des Unternehmens HOERBIGER. Dabei ist es wichtig, durch die Anzahl der Segmente eine optimale Balance zwischen Wirtschaftlichkeit und Grad der Benutzeranforderungsabdeckung zu ermitteln. Diese Untersuchung beschäftigt sich sowohl mit einer theoretischen Abhandlung der Methoden und Verfahren der Marktsegmentierung, als auch mit der praxis relevanten Umsetzung mittels Interviews und statischen Methoden. Entsprechende Aussagen werden durch Recherchen, wie z.B. die Übereinstimmung mit aktuellen IT Trends, bewertet, um eine Schlussfolgerungen auf eine entsprechende Lösung zu erlangen. Die wissenschaftliche Betrachtung wird durch eine detaillierte statistische Analyse belegt und die Ergebnisse der Segmentierung werden entsprechend grafisch illustriert Abschließend gibt ein Vergleich mehrerer Analysen, mit unterschiedlich vielen Clustern, Aufschluss über die optimale Anzahl an Benutzersegmenten.
Clusteralgorithmen oder auch unüberwachte Lernverfahren sind eine wichtige Klasse von Verfahren des maschinellen Lernens mit numerischen bzw. nicht parametrischen Methoden.<br /> Die Bewertung der Ergebnisse dieser Verfahren ist meist jedoch dem Anwender überlassen und daher subjektiv. Damit sind die Vergleichbarkeit und die Optimierung solcher Verfahren recht schwierig.<br /> Im Rahmen der Diplomarbeit sollen Maße recherchiert werden, die dieses Problem beheben.<br /> Anschließend sollen Clusteralgorithmen implementiert und in Hinsicht auf diese Maßegetestet werden.<br />