数据挖掘之聚类分析总结(建议收藏)
if len(set(cluster[j]) & set(cluster[i]))>0 and i!=j: cluster[i] = list(set(cluster[i]) | set(cluster[j])) cluster[j] = list() 最后,找出独立(也就是没有交集)的邻域,就是我们最后的聚类的结果了。 result = dict() j = 0 for i in range(len(cluster)): if len(cluster[i])>0: result[j] = cluster[i] j = j + 1
#找出每个点所在领域的序号,作为他们最后聚类的结果标记 for i in range(len(result)): for j in result[i]: data.at[j, 'type'] = i
plt.scatter(data['x'], data['y'], c=data['type']) 2)基于sklearn包的实现 eps = 0.2 MinPts = 5
model = DBSCAN(eps, MinPts)
data['type'] = model.fit_predict(data)
plt.scatter(data['x'], data['y'], c=data['type']) (编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |