Refine
Document Type
- Master's Thesis (2)
Language
- German (2) (remove)
Keywords
- Computerlinguistik (2) (remove)
Soziale Medien ermöglichen den öffentlichen Austausch von Nachrichten im digitalen Raum. Viele Personen missbrauchen diese Plattformen jedoch für die Verbreitung von Hass. Die Bestimmung und die Prävention derartiger Kommentare stellt eine große Herausforderung dar. In dieser Arbeit werden Möglichkeiten zur Bestimmung und Prognose von Toxizität als Kennzahl
für die sentimentale Ausdrucksform des Hasses aufgezeigt. Nach der begründeten Auswahl der Perspective API als Werkzeug zur Bestimmung von Toxizität werden mit diesem Werkzeug über 600.000 deutschsprachigen Twitter-Kommentare aus dem Frühjahr 2021 annotiert. Die Annotation bildet die Grundlage für die Untersuchung der Ausbreitung toxischer deutscher Sprache.
Mit Methoden der intelligenten Datenanalyse werden im Datensatz Einflussfaktoren ermittelt, die das Absetzen eines toxischen Kommentars begünstigen. Die gefundenen Einflussfaktoren werden final dazu verwendet, um die Toxizität von Antworten, ohne ein Wissen über deren Inhalt,
mit Hilfe künstlicher Intelligenz zu prognostizieren.
Die vorliegende Arbeit beschäftigt sich mit der Konzeption eines Domain-Frameworks für die semantische Analyse von forensischen Textdaten. Die Modellierung einer Taxonomie, sowie einer Ontologie, mit Hilfe von Metadaten soll eine Recherche über einen unbekannten Datenbestand ermöglichen. Als Anwendungsdomäne werden forensische Texte betrachtet.