k-means聚类算法,噪声值怎么处理?
答案:1 悬赏:70
解决时间 2021-10-29 07:22
- 提问者网友:战皆罪
- 2021-10-28 23:32
k-means聚类算法,噪声值怎么处理?
最佳答案
- 二级知识专家网友:旧脸谱
- 2021-10-29 00:54
从你这情况看来貌似属于离群点了啊……离群点会影响聚类效果,应该删掉的
两个方法,你可以试试
一个是你聚类的数量K设大一些,聚类之后把那些零头喀嚓掉,就是那些只有一两个数据点的删掉
还有一个方法就是层次聚类,定义一个合并熵,每次两两合并,合并到一定程度(再合并代价高于一定阈值)之后,把落单的那些删掉
当然最简单的办法,看你这个属于一维,应该是可以直接定一个阈值把阈值以上的砍掉的,当然如果你说数值比较大的部分也需要聚一个类出来的话,那还是采用上面说的第二种方法吧
两个方法,你可以试试
一个是你聚类的数量K设大一些,聚类之后把那些零头喀嚓掉,就是那些只有一两个数据点的删掉
还有一个方法就是层次聚类,定义一个合并熵,每次两两合并,合并到一定程度(再合并代价高于一定阈值)之后,把落单的那些删掉
当然最简单的办法,看你这个属于一维,应该是可以直接定一个阈值把阈值以上的砍掉的,当然如果你说数值比较大的部分也需要聚一个类出来的话,那还是采用上面说的第二种方法吧
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯