VisionGaiaNews
Live System
AI GENERATED 06.01.2026 • 01:55 Wissenschaft & Forschung

Neuer adaptiver Algorithmus verbessert Online-Clustering von Datenströmen

Ein von Forschern der Bielefeld University of Applied Sciences and Arts entwickelter Algorithmus ermöglicht es, Datenströme in Echtzeit zu clustern, ohne vorher die Anzahl der Cluster festzulegen. Der Ansatz, genannt H‑NGPCA, kombiniert hierarchische, modellbasierte und centroid‑basierte Verfahren und passt sowohl die Clusteranzahl als auch die Dimensionalität lokal an.

Funktionsweise des Verfahrens

H‑NGPCA baut einen hierarchischen Baum aus lokalen Principal Component Analysis‑Einheiten (PCA‑Units) auf. Jede Einheit wird als Hyper‑Ellipsoid modelliert, dessen Form durch ein neuronales Netzwerk‑basiertes Online‑PCA aktualisiert wird. Die Positionierung der Einheiten erfolgt über das Neural‑Gas‑Verfahren, ein centroid‑basiertes Clustering‑Verfahren.

Adaptive Struktur und Dimension

Im Baum wird ein neuer Knoten erstellt, sobald ein Splitting‑Kriterium dies verlangt. Gleichzeitig bestimmt jede Einheit eigenständig, welche Dimensionalität für die von ihr repräsentierten Daten optimal ist, wodurch die Methode flexibel auf wechselnde Datencharakteristika reagieren kann.

Leistungsbewertung

In umfangreichen Benchmarks übertraf H‑NGPCA alle getesteten Online‑Clustering‑Algorithmen mit adaptiver Clusterzahl und erreichte gleichzeitig vergleichbare Ergebnisse zu den besten Offline‑Methoden. Die durchschnittliche Normalized Mutual Information lag bei NMI = 0,87 und der Clustering‑Index bei CI = 0,26.

Publikation und Verfügbarkeit

Die Ergebnisse wurden am 5. Januar 2026 in der Fachzeitschrift PLOS ONE (Band 21, Ausgabe 1, e0339171, DOI 10.1371/journal.pone.0339171) veröffentlicht. Alle zu reproduzierenden Daten stehen als unterstützende Informationsdateien bereit und sind über die Clustering‑Benchmark‑Datenbank (https://doi.org/10.1007/s10489-018-1238-7) zugänglich.

Finanzierung und Interessenkonflikte

Die Forschung wurde vom Bundesministerium für Bildung und Forschung (BMBF) im Projekt VIP4PAPS gefördert. Die Autoren erklärten, dass keine Interessenkonflikte vorliegen.

Dieser Bericht basiert auf Informationen von PLOS ONE, lizenziert unter Creative Commons BY 4.0 (Open Access). Wissenschaftliche Inhalte, offen zugänglich.

Ende der Übertragung

Originalquelle

Hinweis zu Quellen & Lizenzen

Die Berichterstattung von VisionGaia News basiert auf öffentlich zugänglichen Informationen aus staatlichen, institutionellen und offen lizenzierten Quellen.

Bezugsquellen:

  • Deutsche Bundesbehörden (z. B. Bundestag, Bundesregierung)
  • Institutionen der Europäischen Union
  • Regierungsstellen des Vereinigten Königreichs
  • Behörden der Vereinigten Staaten
  • Internationale Organisationen (z. B. UN, WHO, Weltbank)
  • Open-Content-Projekte (z. B. Wikinews, Global Voices)
  • Staatliche Quellen aus Drittstaaten (z. B. Russland)

Verwendete Lizenzen & Rechtsgrundlagen:

  • Amtliches Werk gemäß § 5 UrhG (Deutschland)
  • Creative Commons BY 4.0 (Europäische Union)
  • Open Government Licence v3.0 (Vereinigtes Königreich)
  • Open Parliament Licence v3.0 (Vereinigtes Königreich)
  • Public Domain (U.S. Government Work)
  • Public Data / Terms of Use (internationale Organisationen)
  • Creative Commons BY (Open-Content-Projekte)
  • Inhalte offizieller russischer Regierungs- bzw. Staatsquellen (z. B. kremlin.ru, government.ru) — sofern dort angegeben, meist unter CC BY 4.0 bzw. als allgemein zugängliche staatliche Mitteilung
  • Offizielle Dokumente und Rechtsakte aus Russland — viele davon gelten als nicht-urheberrechtspflichtig (Public Domain / government documents), z. B. Gesetze, Verordnungen, Erlasse.

Alle Inhalte werden redaktionell neu formuliert und nicht wortgleich übernommen. Lizenz- und Quellenhinweise finden sich am Ende jedes Artikels.

Staatliche Mitteilungen – auch aus Drittstaaten – werden ausschließlich als Informationsquelle genutzt, neutral dargestellt und nicht wertend übernommen.

Trotz sorgfältiger Verarbeitung kann es in Einzelfällen zu Zuordnungs- oder Darstellungsfehlern kommen. Hinweise nehmen wir ernst und korrigieren diese umgehend.

Privacy Protocol

Wir verwenden CleanNet Technology für maximale Datensouveränität. Alle Ressourcen werden lokal von unseren gesicherten deutschen Servern geladen. Ihre IP-Adresse verlässt niemals unsere Infrastruktur. Wir verwenden ausschließlich technisch notwendige Cookies.
Für Cookies die über das CleanNet hinausgehen, bitte 3. Cookies aktivieren, ansonsten wird alles standardmäßig blockiert. Für mehr Infos die Datenschutzseite lesen.

Core SystemsTechnisch notwendig
External Media (3.Cookies)Maps, Video Streams,Google Analytics etc.
Analytics (Lokal mit Matomo)Anonyme Metriken
Datenschutz lesen