@mastersthesis{Schneider2020, type = {Bachelor Thesis}, author = {Schneider, Meike}, title = {Active Learning als Trainingsstrategie im {\"u}berwachten maschinellen Lernen : eine Anwendung im Gesundheitswesen}, institution = {Angewandte Computer- und Bio­wissen­schaften}, year = {2020}, abstract = {Active Learning (AL) ist eine besondere Trainingsstrategie im {\"u}berwachten maschinellen Lernen, mit dem Ziel die Accuracy eines Klassifikators zu verbessern, indem ein Klassifikator mit nur wenig gelabelten, aber daf{\"u}r hoch informativen Datenpunkten (DP) gelernt wird. In der medizinischen Forschung liegen oftmals nur wenig gelabelte DP vor. AL kann eine sinnvolle Strategie sein, um die Kosten und den Aufwand f{\"u}r das Labeln ungelabelter DP zu senken. Mit Pool-Based AL wurden bisher die gr{\"o}ßten Erfolge verzeichnet. In der vorliegenden Arbeit wurden zwei biologische, bin{\"a}re Klassifikationsprobleme mit Uncertainty Sampling Pool-Based AL und Query by Bagging Comitee Pool-Based AL untersucht. Der Generalized Learning Vector Quantization (GLVQ) und ein Multilayer Perzeptron (MLP) wurden als Klassifikatoren verwendet. Anhand eines linear trennbaren und eines nicht linear trennbaren Datensatzes wurden die Auswirkungen der Anzahl an gelabelten DP, mit welcher die Klassifikatoren zu Beginn trainiert wurden, auf die Accuracy untersucht. Die AL-Accuracy n{\"a}herte sich f{\"u}r das anf{\"a}ngliche Training der Klassifikatoren mit 10 \% gelabelten DP bereits stark an die Accuracy im klassischen maschinellen Lernen an und war teilweise sogar gr{\"o}ßer. In einem weiteren Experiment wurden daher die Klassifikatoren anf{\"a}nglich mit nur 1 \% gelabelten DP trainiert. Es wurde die Auswirkung der Anzahl nachgelabelter DP, mit welcher die Klassifikatoren nachtrainiert wurden, auf die Accuracy untersucht. F{\"u}r den linear trennbaren Datensatz war die Anwendung von AL mit dem GLVQ und 10 nachgelabelten DP sowie mit dem MLP und 50 nachgelabelten DP erfolgreich. Bei dem nicht linear trennbaren Datensatz wurde mit dem MLP zumindest eine Tendenz, dass AL die Accuracy verbessert, festgestellt. Jedoch reichten 50 nachgelabelte DP nicht aus.}, subject = {Gesundheitswesen}, language = {de} }