WordNet-PLSA : Erweiterung der PLSA mit semantischen Wissen aus dem WordNet
WordNet-PLSA : extension of the PLSA with semantic knowledge from WordNet
- Die im Topic Mining verbreiteten Themenmodelle wie Probabilistic Latent Semantic Analysis [17] (PLSA) und Latent Dirichlet Allocation [2] (LDA) basieren auf statistischen Maûen der Dokumente ohne jedoch die Semantik einer Sprache zu berücksichtigen. Entsprechend werden Synonyme oder Über-/Unterbegriffe nicht in die Modellierung einbezogen, sodass wichtige Information nicht betrachtet werden. Das Ziel dieser Arbeit bestand darin, den Nutzen von semantischem Wissen bei der Themenmodellierung zu evaluieren. Dafür wurden verschiedene Ansätze der Anreicherung von Dokumenten mit solchem Wissen genutzt und die Themenzuweisungen durch die PLSA analysiert. Dabei konnte festgestellt werden, dass die Anreicherung zu genaueren Ergebnissen bezüglich der Themenrepräsentation als auch Themen-Dokument-Zuweisung geführt hat. Nach erfolgreicher Erweiterung der Dokumente wurde die PLSA modifiziert, um eine Berücksichtigung weiterer semantischer Relationen zu ermöglichen. Die daraus resultierende WordNet-PLSA erwies sich als vielversprechender Ansatz.
Author: | Eric Enrico Kropf |
---|---|
Advisor: | Dirk Labudde, Michael Spranger |
Document Type: | Bachelor Thesis |
Language: | German |
Date of Publication (online): | 2024/06/15 |
Year of first Publication: | 2024 |
Publishing Institution: | Hochschule Mittweida |
Granting Institution: | Hochschule Mittweida |
Release Date: | 2024/06/15 |
GND Keyword: | WordNet; Semantische Analyse |
Institutes: | Angewandte Computer‐ und Biowissenschaften |
DDC classes: | 401.43 semantische Analyse |
Open Access: | Innerhalb der Hochschule |
Licence (German): | Urheberrechtlich geschützt |