OPUS


Volltext-Downloads (blau) und Frontdoor-Views (grau)
  • search hit 2 of 5
Back to Result List

Iterative Named Entity Annotation eines Textdatensatzes mit Conditional Random Fields

Iterative Named Entity annotation of a text dataset with Conditional Random Fields

  • Die Arbeit untersucht das Problem, der Named Entity Recognition in großen Textkorpora. Für klassische Modelle sind meist große gelabelte Datenmengen nötig, die häufig aber nicht zur Verfügung stehen, weil manuelle Annotation sehr zeitaufwendig ist. Deshalb wurde ein Halbüberwachtes (Semi-Supervised) Verfahren untersucht, um ausgehend von einer kleinen Menge manuell annotierter Daten iterativ mit möglichst wenig Annotationsaufwand ein solides Modell zu trainieren. Das Verfahren nutzt gezielte manuelle Annotation, um den Lerneffekt durch Self-Training zu erhöhen. Die Untersuchungen haben jedoch gezeigt, dass durch Self-Training in diesem Fall keine Verbesserung erzielt werden konnte. Es kann aber eine erhebliche Menge manueller Annotation durch die gezielte Auswahl von statistisch unsicheren Sätzen für die manuelle Annotation eingespart werden und dadurch effizienter eine bessere Performance erreicht werden.

Download full text files

  • BA_Demus.pdf
    deu

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Christoph Demus
Advisor:Dirk Labudde, Eleanor Hobley
Document Type:Bachelor Thesis
Language:German
Year of Completion:2020
Granting Institution:Hochschule Mittweida
Release Date:2022/01/04
GND Keyword:Textverarbeitung; Information Extraction; Algorithmus
Institutes:Angewandte Computer‐ und Bio­wissen­schaften
DDC classes:005.74 Datenintegration, Datenverwaltung
Open Access:Innerhalb der Hochschule
Licence (German):License LogoUrheberrechtlich geschützt