Publikationen an der Fakultät für Informatik und Automatisierung ab 2015

Anzahl der Treffer: 1956
Erstellt: Tue, 16 Jul 2024 23:12:48 +0200 in 0.0713 sec


Zaryab, Muhammad Ateeque; Ng, Chuen Rue
Optical character recognition for medical records digitization with deep learning. - In: 2023 IEEE International Conference on Image Processing, (2023), S. 3260-3263

The importance of document digitization has increased due to recent technological advancements, including in the medical field. Digitization of medical records plays a vital role in the healthcare sector as it helps expedite emergency treatment. Due to the scarcity of published studies and public German textual resources, a medical records database with German handwriting was collected and digitized. In this study, document digitization was accomplished by implementing deep learning, region of interest (ROI) detection, and optical character recognition (OCR) on a dataset containing medical forms filled with German and English characters. To find the best model for ROI detection, YOLOv5, and SSDResNet50 models were utilized and compared with YOLOv5 producing a better mean average precision (mAP) of 0.91. OCR was then carried out on the output from YOLOv5 with two different methods again for comparison. The Gated-CNN-BLSTM algorithm yielded a character error rate (CER) of 9%, while transformer-based OCR (TrOCR) achieved a CER of 6%. The proposed system could be implemented and further tested in local hospitals, with the OCR dictionary being expandable to include other Roman character-based languages.



https://doi.org/10.1109/ICIP49359.2023.10222038
Kuske, Dietrich;
A class of rational trace relations closed under composition. - In: 43rd IARCS Annual Conference on Foundations of Software Technology and Theoretical Computer Science, (2023), S. 20:1-20:20

Rational relations on words form a well-studied and often applied notion. While the definition in trace monoids is immediate, they have not been studied in this more general context. A possible reason is that they do not share the main useful properties of rational relations on words. To overcome this unfortunate limitation, this paper proposes a restricted class of rational relations, investigates its properties, and applies the findings to systems equipped with a pushdown that does not hold a word but a trace.



https://doi.org/10.4230/LIPIcs.FSTTCS.2023.20
Müller, Steffen; Stephan, Benedict; Müller, Tristan; Groß, Horst-Michael
Robust perception skills for autonomous elevator operation by mobile robots. - In: Proceedings of the 11th European Conference on Mobile Robots, (2023), insges. 7 S.

Autonomous mobile service robots with transportation tasks are often restricted to work on a single floor, since remote access to elevators is expensive to integrate for reasons of safety certification. Therefore, already ten years ago first robots have been enabled to use the human interface for riding an elevator. This requires a variety of perception and manipulation capabilities as well as social skills when it comes to interaction with other people who want to use the elevator too. We summarize the progress in solving the specific tasks of detecting and localizing the required buttons to press robustly. A deep-learning approach for detecting buttons in images is combined with a verification based on predefined knowledge on button arrangements in the elevator's control panels. Also perception of the elevator's state and our realization of the robot's elevator riding capabilities are discussed.



https://doi.org/10.1109/ECMR59166.2023.10256353
Fischer, Gerald; Kofler, Markus; Baumgarten, Daniel
Implementation of N-Interval fourier transform analysis - application to compound action potentials. - In: MethodsX, ISSN 2215-0161, Bd. 11 (2023), 102441, S. 1-10

N-Interval Fourier Transform Analysis (N-FTA) allows for spectral separation of a periodic target signal from uncorrelated background interference. A N-FTA pseudo-code is presented. The spectral resolution is defined by the repetition rate of the near periodic signal. Acceptance criteria for spectral targets were defined such that the probability of accepting false positives is less than 1/1500. Simulated and recorded neural compound action potentials (CAPs) were investigated. Simulated data allowed for comparison with reference solutions demonstrating the stability of N-FTA at conditions being comparable to real world data. Background activity was assessed with small errors. Evoked target components were assessed down to power spectral density being approximately N times below the background level. Validation was completed investigating a measured CAP. In neurophysiological recordings, this approach allows for accurate separation of near periodic evoked activity from uncorrelated background activities for frequencies below 1kHz. • N-FTA allows for spectral separation of a periodic target signal from uncorrelated interference by analyzing a segment containing N target signal repetitions. • A MATLAB implementation of the algorithm is provided along with simulated and recorded data. • N-FTA was successfully validated using simulated and measured data for CAPs.



https://doi.org/10.1016/j.mex.2023.102441
Fiedler, Patrique; Graichen, Uwe; Zimmer, Ellen; Haueisen, Jens
Simultaneous dry and gel-based high-density electroencephalography recordings. - In: Sensors, ISSN 1424-8220, Bd. 23 (2023), 24, 9745, S. 1-12

Evaluations of new dry, high-density EEG caps have only been performed so far with serial measurements and not with simultaneous (parallel) measurements. For a first comparison of gel-based and dry electrode performance in simultaneous high-density EEG measurements, we developed a new EEG cap comprising 64 gel-based and 64 dry electrodes and performed simultaneous measurements on ten volunteers. We analyzed electrode-skin impedances, resting state EEG, triggered eye blinks, and visual evoked potentials (VEPs). To overcome the issue of different electrode positions in the comparison of simultaneous measurements, we performed spatial frequency analysis of the simultaneously measured EEGs using spatial harmonic analysis (SPHARA). The impedances were 516 ± 429 kOhm (mean ± std) for the dry electrodes and 14 ± 8 kOhm for the gel-based electrodes. For the dry EEG electrodes, we obtained a channel reliability of 77%. We observed no differences between dry and gel-based recordings for the alpha peak frequency and the alpha power amplitude, as well as for the VEP peak amplitudes and latencies. For the VEP, the RMSD and the correlation coefficient between the gel-based and dry recordings were 1.7 ± 0.7 μV and 0.97 ± 0.03, respectively. We observed no differences in the cumulative power distributions of the spatial frequency components for the N75 and P100 VEP peaks. The differences for the N145 VEP peak were attributed to the different noise characteristics of gel-based and dry recordings. In conclusion, we provide evidence for the equivalence of simultaneous dry and gel-based high-density EEG measurements.



https://doi.org/10.3390/s23249745
Numssen, Ole;
Identification of causal structure-function relationships in the human motor cortex with non-invasive brain stimulation. - Ilmenau : Universitätsbibliothek, 2023. - 1 Online-Ressource (xxiii, 173 Seiten)
Technische Universität Ilmenau, Dissertation 2023

Transkranielle Magnetstimulation (TMS) ist ein nicht-invasives Hirnstimulationsverfahren, das im Klinik- und im Forschungsalltag eingesetzt wird, um kausale Struktur-Funktions-Beziehungen im menschlichen Gehirn zu identifizieren. Mittels eines induzierten elektrischen Feldes wird durch Depolarisierung kortikaler Neuronen aktiv in die Verarbeitung lokal begrenzter Hirnregionen eingegriffen. Allerdings beschränkt die hohe Autokorrelation des induzierten elektrischen Feldes eine präzise Lokalisation des TMS Effekts im kortikalen Gewebe. In dieser Arbeit präsentiere ich ein neues Paradigma, das aktuelle Entwicklungen im Bereich Feldmodellierung verwendet, um die räumliche Auflösung von TMS Lokalisation signifikant zu erhöhen. Stimulationsreaktionen auf verschiedene Stimulationsorte werden in einer Analyse kombiniert um die involvierten Neuronenpopulationen zu identifizieren. Die Stimulation wird quantifiziert mittels hochauflösender Feldberechnungen, um eine realistische Abschätzung der kortikalen Stimulation zu erzielen. Die Güte des funktionalen Zusammenhangs zwischen Feldexposition und modulierten Verhalten wird genutzt, um die involvierte Neuronenpopulation zu identifizieren. Als erste Annäherung verwende ich Input-Output-Kurven für eine Reihe von Stimulationsorten um Muskelrepräsentationen im primären Motorkortex zu lokalisieren. Ich validiere die Ergebnisse experimentell mit Hilfe der Ruhemotorschwelle um die praktische Relevanz einer präzisen Lokalisation aufzeigen. Anschließend entwickele ich einen generalisierten Ansatz, der Stimulationen an beliebigen Orten zulässt, um die praktische Durchführbarkeit und Effizienz zu erhöhen. Diese Implementierung ermöglicht eine robuste und präzise Lokalisierung mehrerer Muskelrepräsentationen zugleich. Um die Einsetzbarkeit dieser Methode zu gewährleisten ist die gesamte Routine, inklusive aller Auswertungsskripte und eines Beispieldatesatzes, im Detail beschrieben und veröffentlicht. Die Verwendung von Aktivierungsfunktionen zur Lokalisierung von Funktionen im Kortex ermöglicht die Verwendung einer Dosierungsmetrik, die auf individuellen, kortikalen Stimulationsschwellen basiert. Eine präzise, individualisierte Dosierungsmetrik kann dazu beitragen, die Sensitivität und Spezifität von TMS signifikant zu erhöhen.



https://doi.org/10.22032/dbt.59164
Schuler, Ramona;
Intraoperatives Neuromonitoring autonomer Beckennerven mittels Bioimpedanzmessung. - Ilmenau : Universitätsbibliothek, 2023. - 1 Online-Ressource (XXII, 137 Blätter)
Technische Universität Ilmenau, Dissertation 2023

Autonome Beckennerven sind bei viszeralchirurgischen Eingriffen im Bereich des kleinen Beckens wie beispielsweise Rektumresektionen bei Rektumkarzinom einem sehr hohen Risiko der intraoperativen iatrogenen Schädigung ausgesetzt. Die Folgen von Schädigungen der Beckennerven sind postoperativ auftretende Funktionsstörungen der Beckenorgane wie Harninkontinenz, Stuhlinkontinenz und sexuelle Funktionsstörungen, die zu einer Beeinträchtigung der Lebensqualität der Patienten führen können. Das autonome Nervengeflecht des Beckens ist hochkomplex, sehr filigran, innerviert glatte Muskulatur und kann in seiner topografischen Lage interindividuell verschieden sein. Da die Nerven rein visuell nur sehr schwer identifiziert werden können, ist deren Schonung im Verlauf der chirurgischen Präparation ohne technische Hilfsmittel und ohne fundierte Kenntnisse der pelvinen Neuroanatomie nicht möglich. Aufgrund der Unterschiede im Erregungs- und Reizreaktionsverhalten zwischen dem somatischen und dem autonomen Nervensystem können bekannte elektrophysiologische Neuromonitoring-Methoden nicht direkt auf das Monitoring autonomer Nerven übertragen werden, wodurch die Entwicklung neuer Methoden notwendig ist. Im Rahmen dieser Arbeit wurde eine neue Neuromonitoring-Methode zur Lokalisation autonomer Nerven mittels elektrischer Stimulation im OP-Gebiet und Impedanzmessung an glatter Muskulatur konzipiert und erforscht. Die bei der Durchführung einer präklinischen, wie auch einer klinischen Studie erzielten Ergebnisse weisen sowohl die technische als auch die klinische Machbarkeit der Impedanzmessung als Verfahren des intraoperativen Neuromonitorings nach und lassen darauf schließen, dass eine nervenschonende Präparation und eine damit verbundene Verminderung des Risikos für das Auftreten von postoperativen Funktionsstörungen der Beckenorgane möglich ist. Die klinische Machbarkeit wurde bei 28 der 30 Patienten (93,3 %) nachgewiesen. Darüber hinaus gehen erste klinische Daten zur klinischen Sicherheit und zum klinischen Nutzen der Methode aus der Auswertung des funktionellen Outcomes der Patienten der klinischen Studie hervor. Der auf der Basis der gewonnenen Messdaten der klinischen Studie realisierte softwaregestützte Automatic Muscle Impedance and Nerve Analyzer (AMINA) zur Beurteilung der abgeleiteten Impedanzsignale soll eine assistierte Signalinterpretation für eine einfache und schnelle Identifikation funktionaler Nerven während der OP möglich machen. Die Validierung des Verfahrens anhand erster Messdaten ergab eine Sensitivität der Signalbeurteilung von 96,3 % und eine Spezifität von 91,2 %.



https://doi.org/10.22032/dbt.59161
Beier, Ines;
A discrete filter perspective of the modulating function method and non-analytic modulating functions. - Ilmenau : Universitätsbibliothek, 2023. - 1 Online-Ressource (XI, 102 Seiten)
Technische Universität Ilmenau, Dissertation 2023

Seit den frühen 50er Jahren hat die Methode der Modulationsfunktionen auf dem Gebiet der Parameter- und Zustandsschätzung dynamischer Systeme, welche durch Differentialgleichungen modelliert werden, an Bedeutung gewonnen. Die vorliegende Arbeit befasst sich mit verschiedenen Aspekten rund um die Modulationsfunktionenmethode. Die Theorie der Modulationsfunktionenmethode bezieht sich auf kontinuierliche Signale. Über die diskrete Implementierung der Methode wurde bisher nur wenig diskutiert. In dieser Arbeit wird die diskrete Umsetzung der Modulationsfunktionenmethode unter Verwendung der Methode der kleinsten Quadrate detailliert betrachtet. Dazu werden die bei der Modulationsfunktionenmethode auftretenden Integrale als MF-Filter (Modulationsfunktionen Filter) interpretiert. Unter Verwendung der Modulationsfunktionenmethode entsteht ein lineares System für unbekannte Parameter. Die Schätzung dieser Parameter erfolgt mit der Methode der kleinsten Quadrate. Bei dieser Methode müssen Matrizen invertiert werden. Die Wahl der Modulationsfunktionen ist entscheidend, um schlecht konditionierte Matrizen zu vermeiden. Im Laufe der Jahre wurden verschiedene Modulationsfunktionen vorgestellt, deren mathematische Eigenschaften bisher nicht untersucht wurden. Als weiterer Beitrag werden insbesondere die polynomialen Modulationsfunktionen aus mathematischer Sicht betrachtet. Es wird untersucht, wie sich diese Funktionen und ihre Ableitungen an den Rändern des Definitionsintervalls verhalten und wie sich dies auf die Kondition der im linearen System auftretenden Matrix auswirkt. Darüber hinaus stellt sich die Frage, ob die Kondition der Matrix durch Skalierung der Modulationsfunktionen wesentlich verbessert werden kann. In diesem Zusammenhang werden skalierte Modulationsfunktionen betrachtet. Bis heute sind viele verschiedene Modulationsfunktionen endlicher Ordnung bekannt. Diese Modulationsfunktionen erfüllen die geforderten Randbedingungen bis zu einer bestimmten Ableitung. Das bedeutet, dass für Probleme höherer Ordnung auch Modulationsfunktionen höherer Ordnung benötigt werden. In dieser Arbeit wird die Idee für zwei neue nicht-analytische Modulationsfunktionen unendlicher Ordnung vorgestellt. Diese Funktionen können beliebig oft abgeleitet werden und erfüllen immer die Randbedingungen. Schließlich wird die diskrete Implementierung der Modulationsfunktionenmethode nicht nur für simulierte Daten, sondern auch für gemessene Daten eines Pendelversuchs verwendet. Die polynomialen Modulationsfunktionen und die neuen Modulationsfunktionen werden zur Schätzung der Parameter, sowohl offline als auch online in Echtzeit, eingesetzt.



https://doi.org/10.22032/dbt.59162
Fischedick, Söhnke Benedikt; Seichter, Daniel; Schmidt, Robin; Rabes, Leonard; Groß, Horst-Michael
Efficient multi-task scene analysis with RGB-D transformers. - In: IJCNN 2023 conference proceedings, (2023), insges. 10 S.

Scene analysis is essential for enabling autonomous systems, such as mobile robots, to operate in real-world environments. However, obtaining a comprehensive understanding of the scene requires solving multiple tasks, such as panoptic segmentation, instance orientation estimation, and scene classification. Solving these tasks given limited computing and battery capabilities on mobile platforms is challenging. To address this challenge, we introduce an efficient multi-task scene analysis approach, called EMSAFormer, that uses an RGB-D Transformer-based encoder to simultaneously perform the aforementioned tasks. Our approach builds upon the previously published EMSANet. However, we show that the dual CNN-based encoder of EMSANet can be replaced with a single Transformer-based encoder. To achieve this, we investigate how information from both RGB and depth data can be effectively incorporated in a single encoder. To accelerate inference on robotic hardware, we provide a custom NVIDIA TensorRT extension enabling highly optimization for our EMSAFormer approach. Through extensive experiments on the commonly used indoor datasets NYUv2, SUNRGB-D, and ScanNet, we show that our approach achieves state-of-the-art performance while still enabling inference with up to 39.1 FPS on an NVIDIA Jetson AGX Orin 32 GB.



https://doi.org/10.1109/IJCNN54540.2023.10191977
Aganian, Dustin; Köhler, Mona; Baake, Sebastian; Eisenbach, Markus; Groß, Horst-Michael
How object information improves skeleton-based human action recognition in assembly tasks. - In: IJCNN 2023 conference proceedings, (2023), insges. 9 S.

As the use of collaborative robots (cobots) in industrial manufacturing continues to grow, human action recognition for effective human-robot collaboration becomes increasingly important. This ability is crucial for cobots to act autonomously and assist in assembly tasks. Recently, skeleton-based approaches are often used as they tend to generalize better to different people and environments. However, when processing skeletons alone, information about the objects a human interacts with is lost. Therefore, we present a novel approach of integrating object information into skeleton-based action recognition. We enhance two state-of-the-art methods by treating object centers as further skeleton joints. Our experiments on the assembly dataset IKEA ASM show that our approach improves the performance of these state-of-the-art methods to a large extent when combining skeleton joints with objects predicted by a state-of-the-art instance segmentation model. Our research sheds light on the benefits of combining skeleton joints with object information for human action recognition in assembly tasks. We analyze the effect of the object detector on the combination for action classification and discuss the important factors that must be taken into account.



https://doi.org/10.1109/IJCNN54540.2023.10191686