k-Means und DBSCAN -Modelle

k-Means und DBSCAN -Modelle


k-means-Clustering ist eine Methode der Vektorquantisierung, die ursprünglich aus der Signalverarbeitung stammt und darauf abzielt, n Beobachtungen in k Cluster zu unterteilen, in denen jede Beobachtung zu dem Cluster mit dem nächsten Mittelwert (Clusterzentren oder Clusterschwerpunkt) gehört. k-Means-Clustering minimiert Varianzen innerhalb des Clusters auf Basis der quadratischen euklidische Abstände.

Bei DBSCAN handelt es sich um einen dichtebasierten ("density based"), nichtparametrischen Clustering-Algorithmus: Bei einer gegebenen Menge von Punkten in einem bestimmten Raum gruppiert er Punkte, die dicht beieinander liegen (Punkte mit vielen ähnlichen Nachbarn), und markiert Punkte, die allein in Regionen mit geringer Dichte liegen (wenige oder keine Nachbarn), als Ausreißer, deren nächste Nachbarn zu weit entfernt sind. DBSCAN ist einer der gebräuchlichsten Clustering-Algorithmen und wird auch am häufigsten in der wissenschaftlichen Literatur zitiert.

Share by: