@mastersthesis{Felser2024, type = {Master Thesis}, author = {Felser, Jenny Maria}, title = {Themenmodellierung in forensischen Kommunikationsdaten}, institution = {Angewandte Computer- und Bio­wissen­schaften}, school = {Hochschule Mittweida}, pages = {110}, year = {2024}, abstract = {Die Auswertung von Kurznachrichten, die auf mobilen Endger{\"a}ten gespeichert sind, nimmt bei strafrechtlichen Ermittlungen immer mehr an Bedeutung zu. H{\"a}ufig sind Ermittler hierbei mit umfassenden Nachrichtenmengen konfrontiert. Um einen {\"U}berblick zu erhalten, w{\"a}re eine kompakte Zusammenfassung der zahlreichen Nachrichten hilfreich. Eine M{\"o}glichkeit diese automatisiert zu erhalten, stellt die Themenmodellierung dar. Diese ist allerdings bei forensischen Kommunikationsdaten mit besonderen Herausforderungen verbunden. Zu diesen z{\"a}hlt die Tatsache, dass der Ermittler oft eine Erwartungshaltung an die Themen hat, wobei die f{\"u}r ihn interessanten Themen h{\"a}ufig nur zu einem geringen Anteil in den Daten vertreten sind. Um ihn bei dem Finden von Beweisen zu diesen Themen zu unterst{\"u}tzen, wurden zwei Methoden der halb{\"u}berwachten Themenmodellierung und Erweiterungen basierend auf Word Embeddings und paradigmatischen Relationen miteinander verglichen. Insbesondere f{\"u}r umgangssprachliche Kurznachrichten ist die Evaluierung der Themenmodellierung als schwierig anzusehen, da bisherige Studien gezeigt haben, dass g{\"a}ngige quantitative Evaluierungsmaße bei diesen nicht unbedingt die tats{\"a}chliche Interpretierbarkeit der Themen widerspiegeln. Daher bestand ein weiteres Ziel der Arbeit darin zu untersuchen, inwieweit die Ergebnisse einer regelm{\"a}ßig angewendeten automatischen Evaluierungsmethode durch eine Nutzerstudie wiedergegeben werden. Insgesamt konnte festgestellt werden, dass nach der quantitativen Evaluierung die halb{\"u}berwachte Themenmodellierung unter Einbeziehung von paradigmatischen Relationen als besonders erfolgversprechend angesehen werden kann, w{\"a}hrend nach der Nutzerstudie vor allem die Word Embeddings die Ergebnisse der halb{\"u}berwachten Themenmodellierung verbessern konnten. Des Weiteren zeigte sich, dass keine Korrelation zwischen den Resultaten der automatischen Evaluierung und der Nutzerstudie vorlag.}, subject = {Textverarbeitung}, language = {de} }