Generierung und Validierung von kurzen Textpassagen mittels verschiedener Verfahren zur Textsynthese
Generation and Validation of short Text Passages using various Text Synthesis Techniques
- Im Rahmen dieser Arbeit wurden mögliche Verfahren zur Textsynthese erforscht, welche den Fokus auf der Erstellung realitätsnaher und lesbarer Varianten auf Grundlage bestehender Texte setzten. Als Use Case für die Data Augmentation von Texten im Umfeld des Natural Language Processing wurden die Verfahren auf einem deutschen Datensatz mit Supportanfragen ausgewählt. Neun bereits validierte und selbst entwickelte Verfahren wurden umgesetzt und auf diesen Daten getestet. Um die Qualität und Ähnlichkeit der synthetisch erzeugten Texte im Vergleich zu den Originaldaten zu bestimmen, wurden Ähnlichkeitsmetriken berechnet. Aufbauend darauf wurden die erzeugten Texte manuell auf deren Grammatik und bestehende Semantik überprüft. Etwa die Hälfte der umgesetzten Verfahren haben Texte erzeugt, die realitätsnah und lesbar waren. Zur Optimierung dieser Verfahren wurden unterschiedliche Parameter getestet und die optimierten Verfahren miteinander verglichen. Erzeugte Texte wurden außerdem im Training im Machine Learning verwendet und deren Einfluss auf das Klassifizierungsverhalten untersucht. Im Machine Learning kam es in allen Verfahren zu einer Verringerungen des Recalls, aber zur Erhöhung der Precision.
Author: | Martin Prause |
---|---|
URN: | urn:nbn:de:bsz:mit1-opus4-158602 |
Advisor: | Christian Roschke, Manuel Heinzig |
Document Type: | Diploma Thesis |
Language: | German |
Date of Publication (online): | 2025/01/13 |
Year of first Publication: | 2025 |
Publishing Institution: | Hochschule Mittweida |
Granting Institution: | Hochschule Mittweida |
Release Date: | 2025/01/13 |
GND Keyword: | Textproduktion; Maschinelles Lernen |
Page Number: | 85 |
Institutes: | Angewandte Computer‐ und Biowissenschaften |
DDC classes: | 006.31 Maschinelles Lernen |
Open Access: | Frei zugänglich |
Licence (German): | ![]() |