Refine
Document Type
- Bachelor Thesis (3) (remove)
Language
- German (3)
Keywords
- Textverarbeitung (3) (remove)
Institute
F. Pfennig untersucht den Nutzen einer Vorlagendatei zur Erstellung wissenschaftlicher Arbeiten im Adobe InDesign-Format in Kontrast zu den bisher bestehenden Dateien von Microsoft Word und Apache OpenOffice Writer an der Fachhochschule Mittweida, University of Applied Sciences. Er ermittelt den bestehenden Bedarf einer solchen Vorlagendatei anhand einer Umfrage unter den Mittweidaer Studenten und wertet diese unter Berücksichtigung der Vor- und Nachteile der betroffenen Programme aus. Dabei kommt er zu dem Ergebnis, dass das Zusammenspiel dieser den größten Erfolg mit sich bringen kann.
Die Arbeit untersucht das Problem, der Named Entity Recognition in großen Textkorpora. Für klassische Modelle sind meist große gelabelte Datenmengen nötig, die häufig aber nicht zur Verfügung stehen, weil manuelle Annotation sehr zeitaufwendig ist. Deshalb wurde ein Halbüberwachtes
(Semi-Supervised) Verfahren untersucht, um ausgehend von einer kleinen Menge manuell annotierter Daten iterativ mit möglichst wenig Annotationsaufwand ein solides Modell zu trainieren. Das Verfahren nutzt gezielte manuelle Annotation, um den Lerneffekt durch Self-Training zu erhöhen. Die Untersuchungen haben jedoch gezeigt, dass durch Self-Training in diesem Fall keine Verbesserung erzielt werden konnte. Es kann aber eine erhebliche Menge
manueller Annotation durch die gezielte Auswahl von statistisch unsicheren Sätzen für die manuelle Annotation eingespart werden und dadurch effizienter eine bessere Performance erreicht werden.