加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 移动互联 > 评测 > 正文

数据挖掘之聚类分析总结(建议收藏)

发布时间:2020-03-20 17:15:28 所属栏目:评测 来源:站长网
导读:聚类分析是按照个体的特征将他们分类,让同一个类别内的个体之间具有较高的相似度,不同类别之间具有较大的差异性 聚类分析属于无监督学习 聚类对象可以分为Q型聚类和R型聚类 Q型聚类:样本/记录聚类 以距离为相似性指标 (欧氏距离、欧氏平方距离、马氏距

        if len(set(cluster[j]) & set(cluster[i]))>0 and i!=j: 

            cluster[i] = list(set(cluster[i]) | set(cluster[j])) 

            cluster[j] = list() 

最后,找出独立(也就是没有交集)的邻域,就是我们最后的聚类的结果了。

result = dict() 

j = 0 

for i in range(len(cluster)): 

  if len(cluster[i])>0: 

    result[j] = cluster[i] 

    j = j + 1 

 

#找出每个点所在领域的序号,作为他们最后聚类的结果标记 

for i in range(len(result)): 

    for j in result[i]: 

        data.at[j, 'type'] = i 

  

plt.scatter(data['x'], data['y'], c=data['type']) 

数据挖掘——聚类分析总结(建议收藏)

2)基于sklearn包的实现

eps = 0.2 

MinPts = 5 

 

model = DBSCAN(eps, MinPts) 

 

data['type'] = model.fit_predict(data) 

 

plt.scatter(data['x'],  data['y'], c=data['type']) 

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读