谱聚类(Spectral Clustering)
利用图论与线性代数发现任意形状的簇——对同心环、弯月形等非凸数据效果显著。
原始数据:两个同心环。K-Means 会按距离质心分割,结果混乱——谱聚类可以正确处理这种非凸形状。
算法步骤
-
1
构建相似度图:计算每对点的相似度,常用高斯核 wij = exp(−‖xi−xj‖² / 2σ²),构成权重矩阵 W。
-
2
构建拉普拉斯矩阵:L = D − W,其中 D 是度矩阵(对角线为各行权重之和)。
-
3
求特征向量:取 L 最小的 k 个特征值对应的特征向量,组成新的低维表示矩阵。
-
4
在新空间聚类:对特征向量矩阵的行向量用 K-Means 聚类,将结果映射回原空间。