启发式聚类算法(目前流行和先进的聚类算法有哪些)
下面是好好范文网小编收集整理的启发式聚类算法(目前流行和先进的聚类算法有哪些),仅供参考,欢迎大家阅读!
可能性C均值聚类算法(Possibilistic C-means clustering algorithm, PCM)是一种经典的聚类算法,它在传统的模糊C均值(FCM)聚类算法的基础上引入了“可能性”概念,以更好地处理数据点与多个簇之间的模糊关系。PCM算法通过考虑数据点属于不同簇的可能性来进行聚类,因此对于那些难以明确划分到一个特定簇的数据点,PCM算法能够提供更灵活的聚类结果。
与FCM相比PCM算法的关键思想是在聚类过程中引入了可能性权重,这样可以更灵活地描述数据点与不同簇之间的关系,从而提高了模糊性数据的聚类效果。相比传统的C均值聚类算法,PCM算法对于具有不确定性或模糊性的数据能够更准确地进行聚类,因此在实际应用中具有一定的优势。
其基本步骤和FCM算法相似,还不知道FCM算法的小伙伴可以参考
初始化:随机初始化聚类中心,并给定可能性权重的初始值。
计算隶属度矩阵:根据当前的聚类中心和可能性权重计算每个数据点对于各个簇的隶属度,这里使用了自定义的可能性权重来代替传统模糊C均值算法中的隶属度矩阵。
更新聚类中心和可能性权重:通过最小化目标函数来更新聚类中心和可能性权重,使得每个数据点与每个簇的可能性权重都能得到合适的调整。
重复迭代:重复进行步骤2和3,直到满足停止条件(例如达到最大迭代次数或聚类中心变化较小)。
关于其具体原理可以参考[1],接下来将用PCM对鸢尾花例子进行聚类,基础代码如下
参考文献[1]范九伦, 高梦飞, 于海燕, 陈斌斌. 基于半监督信息的截集式可能性C-均值聚类算法[J]. 电子与信息学报, 2021, 43(8): 2378-2385. doi: 10.11999/JEIT200757