Skip to content
Licensed Unlicensed Requires Authentication Published by De Gruyter (O) August 9, 2016

Die Regelung von Daten: Eine Idee zur Clusteranalyse von vernetzten Datenbeständen

Data control: a feedback control design for clustering of networked data
  • Volker Willert

    Dr.-Ing. Volker Willert ist Gruppenleiter der Forschergruppe Autonome Systeme und Mobile Robotik des Fachgebietes Regelungstheorie und Robotik unter der Leitung von Prof. Dr.-Ing. J. Adamy am Institut für Automatisierungstechnik und Mechatronik im Fachbereich Elektrotechnik und Informationstechnik der Technischen Universität Darmstadt. Hauptarbeitsgebiete: Inferenzmethoden in der Regelungstechnik, maschinelles Sehen, Mustererkennung, Multi-Agenten-Systeme.

    Technische Universität Darmstadt, Institut für Automatisierungstechnik und Mechatronik, Fachgebiet Regelungsmethoden und Robotik, Landgraf-Georg-Str. 4, 64283 Darmstadt

    EMAIL logo
    and Matthias Schnaubelt

    Matthias Schnaubelt hält einen Master und Bachelor in Physik sowie einen Bachelor in Informationssystemtechnik. Während seiner Abschlussarbeit am Fachgebiet Regelungstheorie und Robotik am Institut für Automatisierungstechnik und Mechatronik im Fachbereich Elektrotechnik und Informationstechnik der Technischen Universität Darmstadt beschäftigte er sich mit Clustering-Algorithmen. Hauptarbeitsgebiete: Datenanalyse, Variational Bayes Clustering.

    Rudolf-Bultmann-Str. 9, D-35039 Marburg

Zusammenfassung

Der Beitrag befasst sich mit der Frage, wie die Clusteranalyse von dezentral abgelegten vernetzten Datenbeständen sowohl im Bezug auf die Konvergenzgeschwindigkeit als auch auf die zu erreichende Güte der Datenzerlegung verbessert werden kann. Dazu wird die Idee der Regelung von Daten über einen Datenregler vorgestellt. Für das K-means Clusteringverfahren wird ein beweisbar konvergenter Datenregler entworfen und anhand eines umfangreichen Benchmarks evaluiert. Des Weiteren wird eine Matrix zur Beschreibung von Zugehörigkeitsübergängen von Clusterdynamiken eingeführt und die Verwandtschaft des Datenreglers zu Kernelmethoden aufgezeigt. Außerdem wird die Beziehung zwischen dem Datenregler und Consensusdynamiken für Multi-Agenten-Systeme hergestellt. Damit ist das vorgestellte Verfahren verteilt implementierbar und auf große dezentral abgelegte Datenmengen anwendbar.

Abstract

This paper deals with the question how clustering of decentrally stored and networked data can be improved in matters of convergence speed and the clustering performance via the influence of data points using a new data controller. For the K-means clustering algorithm a provably convergent data controller is designed and evaluated on a comprehensive benchmark. Further on, a matrix to describe assignment changes along the clustering iterations is introduced and the affinity of controlling data and kernel methods is shown. In addition, the relation between the designed data controller and the consensus protocol for multi-agent-systems is presented. This shows, that the proposed method can be implemented distributively and be applied to decentrally stored big data.

Über die Autoren

Volker Willert

Dr.-Ing. Volker Willert ist Gruppenleiter der Forschergruppe Autonome Systeme und Mobile Robotik des Fachgebietes Regelungstheorie und Robotik unter der Leitung von Prof. Dr.-Ing. J. Adamy am Institut für Automatisierungstechnik und Mechatronik im Fachbereich Elektrotechnik und Informationstechnik der Technischen Universität Darmstadt. Hauptarbeitsgebiete: Inferenzmethoden in der Regelungstechnik, maschinelles Sehen, Mustererkennung, Multi-Agenten-Systeme.

Technische Universität Darmstadt, Institut für Automatisierungstechnik und Mechatronik, Fachgebiet Regelungsmethoden und Robotik, Landgraf-Georg-Str. 4, 64283 Darmstadt

Matthias Schnaubelt

Matthias Schnaubelt hält einen Master und Bachelor in Physik sowie einen Bachelor in Informationssystemtechnik. Während seiner Abschlussarbeit am Fachgebiet Regelungstheorie und Robotik am Institut für Automatisierungstechnik und Mechatronik im Fachbereich Elektrotechnik und Informationstechnik der Technischen Universität Darmstadt beschäftigte er sich mit Clustering-Algorithmen. Hauptarbeitsgebiete: Datenanalyse, Variational Bayes Clustering.

Rudolf-Bultmann-Str. 9, D-35039 Marburg

Danksagung

Wir bedanken uns bei Moritz Schneider für die hilfreichen Diskussionen über die Verwandtschaft zu Kernelmethoden, bei Tatiana Tatarenko, Sebastian Bernhard und Maximillian Löffler für die Diskussionen über die Konvergenzeigenschaften der Datenregelung und bei Dominik Haumann und Stefan Gering für die Vorarbeiten im Bereich der Consensus Regelung und des N-Consensus Problems.

Erhalten: 2016-4-1
Angenommen: 2016-7-8
Online erschienen: 2016-8-9
Erschienen im Druck: 2016-8-28

©2016 Walter de Gruyter Berlin/Boston

Downloaded on 1.5.2024 from https://www.degruyter.com/document/doi/10.1515/auto-2016-0059/html
Scroll to top button