Merkmale toxischer und aggressiver Kommentare in sozialen Netzwerken : und deren numerische Bewertung mithilfe von Deep Learning
Features of toxic and agressive social media comments : methods of numerical evaluation employing deep learning
- In dieser Masterthesis wird evaluiert, wie gut sich Deep-Learning-Modelle für eine Toxizitätsbestimmung im digitalen Raum eignen. Hierfür wird die Transformer-Architektur anhand verschiedener Pre-Trainings auf BERT-, DistilBERT-, RoBERTa- und GPT-2-Basis mithilfe der toxisch-binär annotierten GermEval-Datensätze aus den Jahren 2018, 2019 und 2021 angepasst. Das Feintuning der Modelle findet sowohl mit Supervised-, als auch mit Semi-Supervised-Learning via GAN statt. Im Anhang dieser Arbeit steht der genutzte Programmcode zur Verfügung. Das Feintuning via GAN stellt eine Besonderheit in der Herangehensweise automatisierter NLP-Aufgaben darf. Als Ergebnis dieser Arbeit kann deren Wirksamkeit in binären Textklassifizierungsaufgaben im deutschen Sprachraum bestätigt werden. Onlinequellen wurden zum Zeitpunkt des Abrufs mithilfe des Firefox-Addons “SingleFile” in eine HTML-Datei gespeichert. Sowohl der HTML-Teil, als auch die Mediendateien, Stylesheets und Skriptdateien befinden sich komprimiert in der Datei. Jede Onlinequelle wurde während des Speichervorgangs bei woleet.io registriert, sodass später die Integrität der HTML-Datei geprüft werden kann. Hierfür speichert Woleet die Signatur und Zeitstempel einer Datei innerhalb der Bitcoin-Blockchain. Soll die Integrität einer Datei geprüft werden, kann dies über gildas-lormeau.github.io/singlefile-woleet/index.html erfolgen.
Author: | Thomas Schäfer |
---|---|
Advisor: | Dirk Labudde, Michael Spranger |
Document Type: | Master's Thesis |
Language: | German |
Year of Completion: | 2021 |
Granting Institution: | Hochschule Mittweida |
Release Date: | 2023/04/20 |
GND Keyword: | Deep learning |
Institutes: | Angewandte Computer‐ und Biowissenschaften |
Open Access: | Frei zugänglich |
Licence (German): | Urheberrechtlich geschützt |