OPUS


Volltext-Downloads (blau) und Frontdoor-Views (grau)

Generierung und Validierung von kurzen Textpassagen mittels verschiedener Verfahren zur Textsynthese

Generation and Validation of short Text Passages using various Text Synthesis Techniques

  • Im Rahmen dieser Arbeit wurden mögliche Verfahren zur Textsynthese erforscht, welche den Fokus auf der Erstellung realitätsnaher und lesbarer Varianten auf Grundlage bestehender Texte setzten. Als Use Case für die Data Augmentation von Texten im Umfeld des Natural Language Processing wurden die Verfahren auf einem deutschen Datensatz mit Supportanfragen ausgewählt. Neun bereits validierte und selbst entwickelte Verfahren wurden umgesetzt und auf diesen Daten getestet. Um die Qualität und Ähnlichkeit der synthetisch erzeugten Texte im Vergleich zu den Originaldaten zu bestimmen, wurden Ähnlichkeitsmetriken berechnet. Aufbauend darauf wurden die erzeugten Texte manuell auf deren Grammatik und bestehende Semantik überprüft. Etwa die Hälfte der umgesetzten Verfahren haben Texte erzeugt, die realitätsnah und lesbar waren. Zur Optimierung dieser Verfahren wurden unterschiedliche Parameter getestet und die optimierten Verfahren miteinander verglichen. Erzeugte Texte wurden außerdem im Training im Machine Learning verwendet und deren Einfluss auf das Klassifizierungsverhalten untersucht. Im Machine Learning kam es in allen Verfahren zu einer Verringerungen des Recalls, aber zur Erhöhung der Precision.

Download full text files

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Martin Prause
URN:urn:nbn:de:bsz:mit1-opus4-158602
Advisor:Christian Roschke, Manuel Heinzig
Document Type:Diploma Thesis
Language:German
Date of Publication (online):2025/01/13
Year of first Publication:2025
Publishing Institution:Hochschule Mittweida
Granting Institution:Hochschule Mittweida
Release Date:2025/01/13
GND Keyword:Textproduktion; Maschinelles Lernen
Page Number:85
Institutes:Angewandte Computer‐ und Bio­wissen­schaften
DDC classes:006.31 Maschinelles Lernen
Open Access:Frei zugänglich
Licence (German):License LogoUrheberrechtlich geschützt