006.35 Computerlinguistik
Refine
Document Type
- Master's Thesis (2)
Language
- German (2)
Keywords
- Computerlinguistik (1)
- Datenbank (1)
- Datenverarbeitung (1)
- Künstliche Intelligenz (1)
- Social Media (1)
- Textanalyse (1)
- Textverstehendes System, (1)
- Visualisierung (1)
Institute
Die vorliegende Arbeit präsentiert eine innovative, semi-automatisierte Methode zur Erstellung und Validierung historischer Ereignisdatenbanken. Damit wird ein Beitrag zur Bewältigung der steigenden Anforderungen der Digitalisierung in der Geschichtswissenschaft geleistet. Das Ziel besteht in der effizienten Erfassung historischer Daten sowie deren Darstellung in einer benutzerfreundlichen, interaktiven Form.
Die Kombination von Large Language Models (LLMs), wie beispielsweise ChatGPT, mit fortschrittlichen Visualisierungstechniken resultierte in der Entwicklung einer Methode, welche eine Datenextraktionspipeline mit interaktiven kartografischen Darstellungen integriert. Die entwickelte Methode ermöglicht die verständliche und zugängliche Präsentation historischer Ereignisse im räumlichen und zeitlichen Kontext.
Die entwickelte Methode wurde in einer Vergleichsstudie evaluiert, in welcher die Lern- und Nutzungserfahrungen von Probanden untersucht wurden. Die Resultate demonstrieren, dass die interaktive Visualisierung das Interesse und die Zufriedenheit der Nutzer signifikant fördert, jedoch auch die kognitive Belastung potenziell erhöht. Dies verdeutlicht die Notwendigkeit, benutzerfreundliche Schnittstellen zu entwickeln, die es ermöglichen, komplexe Informationen leicht zugänglich zu machen.
Insgesamt leistet die Arbeit einen wichtigen Beitrag zur digitalen Transformation der Geschichtswissenschaften, indem sie neue Möglichkeiten für die effiziente Erfassung und interaktive Präsentation historischer Daten aufzeigt. Die Erkenntnisse bieten wertvolle Ansätze für zukünftige Forschungen zur Verbesserung der Zugänglichkeit und Effektivität digitaler Geschichtsanalyse-Tools.
Soziale Medien ermöglichen den öffentlichen Austausch von Nachrichten im digitalen Raum. Viele Personen missbrauchen diese Plattformen jedoch für die Verbreitung von Hass. Die Bestimmung und die Prävention derartiger Kommentare stellt eine große Herausforderung dar. In dieser Arbeit werden Möglichkeiten zur Bestimmung und Prognose von Toxizität als Kennzahl
für die sentimentale Ausdrucksform des Hasses aufgezeigt. Nach der begründeten Auswahl der Perspective API als Werkzeug zur Bestimmung von Toxizität werden mit diesem Werkzeug über 600.000 deutschsprachigen Twitter-Kommentare aus dem Frühjahr 2021 annotiert. Die Annotation bildet die Grundlage für die Untersuchung der Ausbreitung toxischer deutscher Sprache.
Mit Methoden der intelligenten Datenanalyse werden im Datensatz Einflussfaktoren ermittelt, die das Absetzen eines toxischen Kommentars begünstigen. Die gefundenen Einflussfaktoren werden final dazu verwendet, um die Toxizität von Antworten, ohne ein Wissen über deren Inhalt,
mit Hilfe künstlicher Intelligenz zu prognostizieren.