Session 9: Clustering Without Crying

The Clustering Toolkit

K-Means: Fast, simple, assumes spherical clusters

from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=3)
labels = kmeans.fit_predict(X)

DBSCAN: Finds arbitrary shapes, handles noise

from sklearn.cluster import DBSCAN
dbscan = DBSCAN(eps=0.5, min_samples=5)
labels = dbscan.fit_predict(X)

Hierarchical: Builds tree of clusters

from sklearn.cluster import AgglomerativeClustering
hclust = AgglomerativeClustering(n_clusters=3)
labels = hclust.fit_predict(X)

Clustering Without Crying