006.4 Mustererkennung, Biometrie, Objekterkennung
Refine
Document Type
- Bachelor Thesis (11)
- Master's Thesis (2)
Keywords
- Objekterkennung (5)
- Biometrie (4)
- Motion Capturing (3)
- Gesichtserkennung (2)
- Künstliche Intelligenz (2)
- Maschinelles Lernen (2)
- Algorithmus (1)
- Field programmable gate array (1)
- Kugelspalt (1)
- Künstlicher Mensch (1)
Institute
Die vorliegende Arbeit befasst sich mit der Entwicklung eines FPGA-Designs zur Berechnung von richtungsgebundenen Objektdaten unter Verwendung eines Triangulations-Algorithmus. Das Ziel ist die Synthese des Systems auf einem FPGA sowie dessen Integration in ein mobiles Warnsystem. Die Ultraschallrohdaten werden dem FPGA von einem Mikrocontroller des mobilen Warnsystems bereitgestellt, während die erkannten Objekte nach der Auswertung zurück an den Mikrocontroller gesendet werden.
Diese Arbeit untersucht zwei Methoden zur Erkennung von Hindernissen vor dem JetBot mittels Computer Vision und vergleicht diese mit dem KI-basierten Algorithmus des JetBot. Es werden die Prinzipien der Stereo-Vision, traditionelle Bildverarbeitungstechniken und KI-Methoden zur Hinderniserkennung analysiert. Der Fokus liegt auf der Bewertung von Effizienz, Genauigkeit und praktischer Anwendbarkeit der Ansätze sowie auf der Entwicklung kosteneffizienter Lösungen für intelligente Fahrsysteme.
Digitale Menschen, die mittels Künstlicher Intelligenz, Motion Capture oder Volumetric Capture erstellt werden, sind zunehmend ein Thema öffentlicher Diskussionen. Dennoch fehlen bislang Studien, die sich mit der menschlichen Wahrnehmung digitaler Avatare auseinandersetzen.
Das Ziel der Arbeit ist es daher, herauszufinden, wie Nutzer digitale Menschen in einer Mixed-Reality-Umgebung wahrnehmen und inwiefern die Aufnahmetechnik bei der Erstellung digitaler Avatare die Präsenzwahrnehmung beeinflusst.
Um die Forschungsfrage zu beantworten, wurde eine qualitative Studie mittels der Beobachtungsmethode des „Lauten Denkens“ durchgeführt. Dabei wurden die Reaktionen der Probanden auf digitale Avatare, die mittels Motion Capture und Volumetric Capture erstellt wurden, in Mixed-Reality-Räumen miteinander verglichen.
Die Untersuchung hat ergeben, dass Nutzer großen Wert auf die Authentizität digitaler Menschen legen, was ihre Selbstwahrnehmung im Raum fördert und dazu führt, dass diese als präsent empfunden werden. Im Vergleich zu Motion Capture, werden die durch Volumetric Capture erstellten digitalen Avatare als präsenter wahrgenommen. Die gesteigerte Präsenzwahrnehmung hängt vor allem mit der Möglichkeit zur Erzeugung photorealistischer und authentischer 3D-Modelle zusammen. Emotionen und echte menschliche Bewegungen können detailgetreu in die digitale Welt übertragen werden.
The GeoFlow II experiment aims to replicate Earth’s core dynamics using a rotating spherical container with controlled temperature differences and simulated gravity. During the GeoFlow II campaign, a massive dataset of images was collected, necessitating an automated system for image processing and fluid flow visualization in the northern hemisphere of the spherical container. From here, we aim to detect the special structures appearing on the post processed images. Recognizing YOLOv5’s proficiency in object detection, we apply Yolov5 model for this task.
In dieser Arbeit werden das Parameterbasierte Verfahren StyleFlow und das semantische System StyleClip untersucht um das StyleGan zu kontrollieren. Dabei sollen die gewählten Attribute bestmöglich editiert werden und sich dabei möglichst wenig gegenseitig beeinflussen. Zusätzlich Experimente auf realen Daten zeigen, dass durch die Invertierung in den Raum des StyleGan Fehler in den Attributen auftreten und bei der Editierung vermehrt Artefakte auftreten. In weiteren Untersuchungen werden die beiden Systeme genutzt, um zum einem Veränderungen entsprechend dem realen Verhalten durchzuführen und zum anderem eine Attributverteilung von Identitäten auf eine andere zu Übertragen. Dabei wird auch die Bildqualität allgemein und für eine Gesichtserkennung untersucht. Mit den untersuchten Systemen sind diese Operationen zu einem gewissen Maß möglich, dabei fällt die Bewertung aufgrund relativer Metriken schwierig.
Die Biometrie bildet in heutigen Zeiten in den Bereichen der forensischen Arbeit und der Sicherheit ein besonderen Teil. Dabei werden in heutigen Verfahren biometrische Merkmale wie Gesichtsmaße, Fingerabdrücke oder auch Irismuster verwendet. Jedoch stößt die Verwendung dieser Merkmale oft an ihrer Grenzen, wenn es darum geht, vermummte Täter auf Überwachungsaufnahmen zu identifizieren. An dieser Stelle soll der Täter mittels eines Rigs auf der Aufnahme vermessen werden. Die erhaltenen Maße sollen anschließend mit den Maßen von Personen im Reale verglichen werden, um dadurch den Täter von der Aufnahme zu identifizieren. In dieser Arbeit wird ein gegebener Datensatz näher untersucht. Der Datensatz enthält anthropometrische Maße, Front-Rigs (2D-Rigs) sowie 3D-Rigs von 170 Frauen und 170 Männern. Ziel soll es sein, die im Datensatz gegebene Separierbarkeit mittels eines optimalen Trenn- beziehungsweise Klassifikationsverfahrens nachzuweisen. Zum Einen wird die Vergleichbarkeit der Front- und 3D-Rigs überprüft. Dafür wird eine Möglichkeit gesucht, eine mögliche Abweichung zwischen den Dimensionen der Rigs mittels eines allgemeinen Fehlers beziehungsweise Verhältnisses auszudrücken. Zum Anderen werden verschiedene Klassifikationsverfahren durchgeführt, die zwischen zwei Körperhöhengruppen gegebene Separierbarkeit optimal nachzuweisen. Abschließend wird ein weiteres Merkmal neben der Körperhöhe gesucht, um Personen in Gruppen einzuteilen. Im Verlauf der Arbeit wird ersichtlich, dass zwischen den Front-Rigs und 3DRigs ein Unterschied besteht, der sich jedoch schwer in ein allgemeinen Fehler beziehungsweise ein allgemeines Verhältnis fassen lässt. Mittels der Manhattan-Distanz kann die Separierbarkeit nur schwer nachgestellt werden. Durch die Verwendung von k-NNs und logistischen Regressionen ist die Separierbarkeit trotz auftretender Falschklassifikationen nachzuweisen. Als weiteres Merkmal zur Körperhöhe wird das Verhältnis von Oberkörper zu Unterkörper betrachtet. Die mittels dieses Verhältnisses bestimmten Gruppen sind ebenfalls nachweisbar. In Zukunft sollte der Unterschied zwischen Front- und 3D-Rigs verkleinert beziehungsweise verallgemeinert werden, um die Vergleichbarkeit zu steigern. Des Weiteren sollte die Separierbarkeit mittels weiterer Klassifikationverfahren nachgewiesen werden. Außerdem sollte über eine Erweiterung des Datensatzes um weitere Individuen oder auch andere Körperhöhen nachgedacht werden. Zudem sollten auch andere Merkmale zur Gruppierung der Personen weiter untersucht werden.
Serielle Auswertung von Datensätzen einer Wildtierkamera mit dem Schwerpunkt Kennzeichendetektion
(2022)
Nummernschild- und Objektdetektion sind wichtige Bestandteile der Verkehrsüberwachung. Jedoch befassen sich die meisten Forschungsarbeiten zu diesen Themen mit der Detektion auf gut beleuchteten Bildern und nur wenige mit der Detektion auf sehr schlecht beleuchteten Aufnahmen. Diese Arbeit versucht, verschiedene Objektdetektionsalgorithmen auf schlecht beleuchteten Bildern zu vergleichen, sowie den Einfluss verschiedener einfacher Bildverbesserungsmethoden auf das Detektionsergebnis zu bewerten. Auf Grundlage dieser Ergebnisse wird anschließend eine Anwendung entwickelt, welche automatisiert Datensätze mehrerer Wildtierkameras auswertet, um diese zur einfacheren Verwendung zur Verfügung zu stellen.
Die vorliegende Bachelorarbeit beschäftigt sich mit Objekterkennung im Kontext des maschinellen Lernens. Analysiert werden zwei Kategorie Algorithmen R-CNN und YOLO von Objekterkennung. Mit Matlab werden der offizielle Code durchführen, um darin einiges Objekt zu erkennen. Verschiedene Algorithmen haben unterschiedlichen Prinzipien und Prozesse. Nach Läufen können sie bei viele Bereiche verglichen und bewertet worden. Die Ergebnisse zeigten die Genauigkeit usw. Im Rahmen dieser Bachelorarbeit werden 3 verschiedenen Algorithmus getestet, um der Objekterkennungsfähigkeit der drei Algorithmen für denselben Datensatz unter derselben Betriebsumgebung zu vergleichen.
Diese Bachelorarbeit befasst sich mit der Analyse des Tippverhaltens und wie sich dieses zur Identifizierung nutzen lässt. Dazu werden anhand eines selbst geschriebenen Keylisteners dreißig Personen gebeten, vorgegebene Texte abzutippen und zuvor persönliche Informationen über die eigene Person anzugeben. Diese Daten werden anschließend ausgewertet, indem man personenspezifische Merkmale extrahiert. Parallel tippt eine Testperson die Texte zehn Mal während unterschiedlichen Tageszeiten ab. Aus diesen Daten wird die Standardabweichung herausgerechnet. Anschließend werden vier der bereits teilnehmenden Probanden ein zweites Mal gebeten, die Testsätze erneut einzugeben. Mithilfe des Euklidischen Abstandes werden die Latenzzeiten der Datensätze dazu verwendet, die Identität der erneut Tippenden mit einem der vorherigen Datensätze zu identifizieren. Außerdem werden durch Zuhilfenahme der Standardabweichungs-Werte alle Merkmale gewichtet und durch das Skalarprodukt miteinander verrechnet. Damit wird eine weitere Methode eingesetzt, Datensätze untereinander zu vergleichen und gegebenenfalls gleiche Tipp-Probanden wiederzuerkennen.
Die Motion Capture Technologie wird immer häufiger zur Erstellung von realistisch wirkenden Animationen in Studios hinzugezogen. Die folgende Arbeit soll die Unterschiede zwischen dieser Technologie und der herkömmlichen 3D Keyframe Animation eruieren und dabei insbesondere auf die Entwicklung des AAA-Independent Titels “Hellblade“ eingehen, um dies an einem praktischen Beispiel zu ermessen.