1、用kmeans分为五个聚类,每个聚类内部的数据为一个list,五个list组成聚类中心。
k = 5 # 聚类中心数 kmeans_model = KMeans(n_clusters=k, n_jobs=4, random_state=123) # 聚类中心数,并行的CPU核的数量,随机数种子 fit_kmeans = kmeans_model.fit(airline_scale) # 模型训练 print(kmeans_model.cluster_centers_) # 查看聚类中心 print(kmeans_model.labels_) # 查看样本的类别标签
2、label显示按照kmeans划分之后每个数据属于哪个聚类。
# 统计不同类别样本的数目 r1 = pd.Series(kmeans_model.labels_).value_counts() print('最终每个类别的数目为:\n', r1) result = kmeans_model.predict([[1.5, 1.5, 1.5, 1.5, 1.5]]) print(result) # 最终确定在五个参数都是1.5的情况下的用户属于类别1 3\r1显示每个聚类内部的元素个数,同时测试一组特定特征值的数据会被分配到哪个组中。
本文链接:http://so.lmcjl.com/news/19585/