Publikationen an der Fakultät für Informatik und Automatisierung ab 2015

Anzahl der Treffer: 1956
Erstellt: Wed, 17 Jul 2024 23:08:55 +0200 in 0.0927 sec


Lasch, Robert; Oukid, Ismail; Dementiev, Roman; May, Norman; Demirsoy, Suleyman S.; Sattler, Kai-Uwe
Faster & strong: string dictionary compression using sampling and fast vectorized decompression. - In: The VLDB journal, ISSN 0949-877X, Bd. 29 (2020), 6, S. 1263-1285

String dictionaries constitute a large portion of the memory footprint of database applications. While strong string dictionary compression algorithms exist, these come with impractical access and compression times. Therefore, lightweight algorithms such as front coding (PFC) are favored in practice. This paper endeavors to make strong string dictionary compression practical. We focus on Re-Pair Front Coding (RPFC), a grammar-based compression algorithm, since it consistently offers better compression ratios than other algorithms in the literature. To accelerate compression times, we propose block-based RPFC (BRPFC) which consists in independently compressing small blocks of the dictionary. For further accelerated compression times especially on large string dictionaries, we also propose an alternative version of BRPFC that uses sampling to speed up compression. Moreover, to accelerate access times, we devise a vectorized access method, using Intel® Advanced Vector Extensions 512 (Intel® AVX-512). Our experimental evaluation shows that sampled BRPFC offers compression times up to 190 × faster than RPFC, and random string lookups 2.3 × faster than RPFC on average. These results move our modified RPFC into a practical range for use in database systems because the overhead of Re-Pair-based compression for access times can be reduced by 2 ×.



https://doi.org/10.1007/s00778-020-00620-x
Al-Sayeh, Hani; Hagedorn, Stefan; Sattler, Kai-Uwe
A gray-box modeling methodology for runtime prediction of Apache Spark jobs. - In: Distributed and parallel databases, ISSN 1573-7578, Bd. 38 (2020), 4, S. 819-839

Apache Spark jobs are often characterized by processing huge data sets and, therefore, require runtimes in the range of minutes to hours. Thus, being able to predict the runtime of such jobs would be useful not only to know when the job will finish, but also for scheduling purposes, to estimate monetary costs for cloud deployment, or to determine an appropriate cluster configuration, such as the number of nodes. However, predicting Spark job runtimes is much more challenging than for standard database queries: cluster configuration and parameters have a significant performance impact and jobs usually contain a lot of user-defined code making it difficult to estimate cardinalities and execution costs. In this paper, we present a gray-box modeling methodology for runtime prediction of Apache Spark jobs. Our approach comprises two steps: first, a white-box model for predicting the cardinalities of the input RDDs of each operator is built based on prior knowledge about the behavior and application parameters such as applied filters data, number of iterations, etc. In the second step, a black-box model for each task constructed by monitoring runtime metrics while varying allocated resources and input RDD cardinalities is used. We further show how to use this gray-box approach not only for predicting the runtime of a given job, but also as part of a decision model for reusing intermediate cached results of Spark jobs. Our methodology is validated with experimental evaluation showing a highly accurate prediction of the actual job runtime and a performance improvement if intermediate results can be reused.



https://doi.org/10.1007/s10619-020-07286-y
Chien, Shih-Cheng;
Brain network dynamics in deviance response and auditory perception. - Ilmenau : Universitätsbibliothek, 2020. - 1 Online-Ressource (xi, 117 Seiten, Seite x-xxvi)
Technische Universität Ilmenau, Dissertation 2020

Neuronale Reaktionen auf plötzliche Veränderungen des sensorischen Inputs können in vielen Teilen der sensorischen Bahnen auf verschiedenen Organisationsebenen beobachtet werden. So können beispielsweise Abweichungen, die die Regelmäßigkeit auf verschiedenen Abstraktionsebenen verletzen, als einfache Ein-/Aus-Reaktionen einzelner Neuronen oder als kumulative Reaktionen neuronaler Populationen beobachtet werden. Aufgrund des relativ einheitlichen und selbstähnlichen Verdrahtungsmuster im Kortex scheint es unwahrscheinlich, dass die verschiedenen kortikalen Reaktionen, die unterschiedliche Funktionalitäten unterstützen (z.B. Lückenerkennung, Chunking, etc.), jeweils auf spezialisierten kortikalen Verschaltungsmustern beruhen. Darüber hinaus sprechen reziproke Verdrahtungsmuster (mit heterogenen Kombinationen von exzitatorischen und inhibitorischen Verbindungen) im Kortex für ein generisches Prinzip zur Erkennung von Abweichungen. Das vorgeschlagene generische Prinzip der Abweichungserkennung unterteilt die Erzeugung der Abweichungsreaktion in zwei Funktionsschritte: Regularitätsbildung und Änderungserkennung. Das Prinzip legt nahe, dass die im Kortex beobachteten Reaktionen, wie die kortikalen Ein/Aus-Antworten, die kortikale Auslassungsreaktion (OSR) und die Mismatch-Negativität (MMN), als Änderungsreaktionen auf verschiedenen Abstraktionsebenen betrachtet werden können. Das Netzwerkmodell, das auf diesem Prinzip basiert, reproduziert mehrere experimentell beobachtete Befunde, zu denen die unterschiedlichen zeitlichen Profile der Ein/Aus-Antworten, die lineare Beziehung zwischen OSR-Latenz und Input Stimulus Onset Asynchrony (SOA) und die langsamen und schnellen Reaktionen im Sequenz-MMN-Paradigma gehören. In Bezug auf die Erkennung von Veränderungen deuten die Simulationsergebnisse darauf hin, dass für das Auftreten von Veränderungsdetektoren ein Disinhibitionsmechanismus erforderlich ist. Eine Analyse der Verbindungsstärken im Netzwerk deutet weiterhin auf einen unterstützenden Effekt der synaptischen Anpassung und einen destruktiven Effekt von N-Methyl-D-Aspartat-Rezeptor- (NMDA-r)-Antagonisten auf die Änderungserkennung hin. In Bezug auf die Regularitätsbildung deuten die Simulationsergebnisse auf den Notwendigkeit für ein raumcodierenden Schema, eine größere Zeitkonstante der hemmenden Population und kurzfristige Plastizität hin, um eine stetige neuronale Repräsentation der Regularität zu unterstützen. Für die experimentelle Validierung können wir mehrere Vorhersagen aus dem Modell ableiten. Erstens sollten die verschiedenen kortikalen Abweichungsreaktionen ähnliche laminare Profile aufweisen, insbesondere bzgl. der Aktivität der inhibitorischen Neuronen, in denen die Änderungserkennung stattfindet. Zweitens würden die NMDA-r-Antagonisten im Allgemeinen die kortikale Aus-Reaktion, die kortikale OSR und die MMN dämpfen. Drittens könnte es unterschiedliche räumliche Verteilungen der Änderungserkennung und Regularitätsbildung geben, da die beiden Funktionen aus unterschiedlichen Netzwerkeigenschaften wie Zeitkonstanten und Verbindungsmustern entstehen. Diese Arbeit bietet einen neuen Blickwinkel auf die neuronalen Mechanismen, die der Detektion von Abweichungen zugrunde liegen. Zukünftige Forschungsthemen, wie der Aufmerksamkeitsmechanismus in der Wahrnehmung, die funktionelle Rolle verschiedener Arten von hemmenden Neuronen sowie höhere kognitive Funktionen wie Spracherwerb und -verständnis, können auf der aktuellen Implementierung des Modells basieren.



https://nbn-resolving.org/urn:nbn:de:gbv:ilm1-2020000120
Nguyen, Khoa Dang; Dai, Pham Duc; Vu, Quoc Dong; Cuong, Bui Manh; Tuyen, Vu Phi; Li, Pu
A MINLP model for optimal localization of pumps as turbines in water distribution systems considering power generation constraints. - In: Water, ISSN 2073-4441, Volume 12 (2020), issue 7, 1979, Seite 1-20

Pressure reducing valves (PRVs) are commonly used for pressure control in water distribution systems (WDSs) by means of dissipating the pressure excess. The use of pumps as turbines (PATs) is an alternative and more favorable system since they not only control the system pressure to decrease water leakage, but also utilize the pressure excess to generate electrical energy. The optimal localization of PATs can be casted into a mixed-integer nonlinear program (MINLP) where binary variables are used to represent the presence of PATs on links. Most of the available MINLP models for optimal PAT localization adopted the optimization approaches for PRV localization without considering the bound constraints on flow rates and heads of PATs. As a result, such an optimization model may make PATs delivering a non-desired output. In this paper, we propose a new MINLP model for optimal PAT localization. Instead of using a constraint on the maximum number of PATs to be placed in a WDS, new constraints relating to the minimum power generated by PAT are introduced to find links having adequate flows and head drops for placing PATs. Moreover, constraints are used to restrict flows and heads of PATs to their feasible operating range, so that the problem can be efficiently solved. The proposed MINLP model is applied to the optimal localization of PATs for a WDS benchmark and a real-world WDS in Vietnam. The results demonstrate that the new MINLP model can efficiently identify optimal locations for PAT placement where the specified working range and minimum power generated by the PATs are ensured.



https://doi.org/10.3390/w12071979
Brauer, Jakob Lauritz; Simon, Rowena; Klemm, Matthias; Hammer, Martin
Influence of lens fluorescence on fluorescence lifetime imaging ophthalmoscopy (FLIO) fundus imaging and strategies for its compensation. - In: Translational Vision Science & Technology, ISSN 2164-2591, Bd. 9 (2020), 8, 13, S. 1-10

https://doi.org/10.1167/tvst.9.8.13
Pfeiffer, Michael; Roßberg, Michael; Girlich, Franz; Schäfer, Günter
Vector packet encapsulation: the case for a scalable IPsec encryption protocol. - In: ARES 2020, (2020), insges. 10 S.

The IPsec protocol family, although not always undisputed, has shown to be extremely reliable over the last two decades. However, given the fact that communication networks evolved tremendously since ESP was standardized, this paper proposes changes to the security protocol to accommodate for the needs of modern wide area and data center networks. In particular it addresses optimizations for high-speed software implementations as well as use cases in data center networks. The evaluation shows that rather small yet targeted changes are sufficient to allow for more flexible and scalable implementations.



https://doi.org/10.1145/3407023.3407060
Grinten, Tim van der; Müller, Steffen; Westhoven, Martin; Wischniewski, Sascha; Scheidig, Andrea; Groß, Horst-Michael; Gross, Horst-Michael
Designing an expressive head for a help requesting socially assistive robot. - In: Human-friendly robotics 2019, (2020), S. 88-102

In this paper, we present the developments regarding an expressive robot head for our socially assistive mobile robot HERA, which among other things is serving as an autonomous delivery system in public buildings. One aspect of that task is contacting and interacting with unconcerned people in order get help when doors are to open or an elevator has to be used. We designed and tested a robot head comprising a pan-tilt unit, 3D-printed shells, animated eyes displayed on two LCD-screens, and three arrays of RGB-LEDs for communicating internal robot states and attracting potential helpers’ interest. An online-study was performed to compare variations of eye-expression and LED lighting. Data was extracted from the answers of 139 participants. Statistical analysis showed significant differences in identification performance for our intended eye-expressions, perceived politeness, help intentions, and hedonic user experience.



Sattler, Kai-Uwe;
Data-driven discovery from a data management perspective: challenges, solutions, and applications. - In: Advances in engineering research and application, (2020), S. vii

Schweitzer, Dietrich; Haueisen, Jens; Brauer, Jakob Lauritz; Hammer, Martin; Klemm, Matthias
Comparison of algorithms to suppress artifacts from the natural lens in fluorescence lifetime imaging ophthalmoscopy (FLIO). - In: Biomedical optics express, ISSN 2156-7085, Bd. 11 (2020), 10, S. 5586-5602

https://doi.org/10.1364/BOE.400059
Poljak, Dragan; Cvetkoviâc, Mario; Doriâc, Vicko; Zulim, Ivana; Џogaš, Zoran; Rogiâc Vidakoviâc, Maja; Haueisen, Jens; Drissi, Khalil El Khamlichi
Integral equation formulations and related numerical solution methods in some biomedical applications of electromagnetic fields: transcranial magnetic stimulation (TMS), nerve fiber stimulation. - In: Data analytics in medicine, (2020), 1, S. 249-267

https://doi.org/10.4018/978-1-7998-1204-3.ch013