k-means——平面上100个样本点的聚类分析(通俗易懂)-APISpace

k-means——平面上100个样本点的聚类分析(通俗易懂)

1、k-means聚类的算法流程

2、一个形象的例子：讲述k-means聚类原理

1）将下面这四个点，分为两类

2）聚类流程如下

3、平面上100个点的k-means聚类分析

代码如下：

import numpy as np# 构造数据集x = np.linspace(0,99,100)y = np.linspace(100,199,100)aa = 0 # aa变量是为了记录，迭代次数k = 2 # 指定将数据分为几个类别n = len(x) # 数据集的个数 # 1、随机选取两个点，作为初始的类中心；center0 = np.array([x[0],y[0]])center1 = np.array([x[1],y[1]])dis = np.zeros([n,k+1])while aa >= 0: # 2、求各样本到各类中心的距离； for i in range(n): dis[i,0] = np.sqrt((x[i]-center0[0])**2+(y[i]-center0[1])**2) dis[i,1] = np.sqrt((x[i]-center1[0])**2+(y[i]-center1[1])**2) # 3、归类：将样本归类为，距离其最近的类中的所属类； dis[i,2] = np.argmin(dis[i,:2]) # 4、再次计算各类样本的均值，作为新的类中心； index0 = dis[:,2] == 0 index1 = dis[:,2] == 1 center0_new = np.array([x[index0].mean(),y[index0].mean()]) center1_new = np.array([x[index1].mean(),y[index1].mean()]) # 5、判断类中心，是否发生变化。如果发生变化，就回到第2步；否则，break退出循环； if all((center0 == center0_new) & (center1 == center1_new)): break center0 = center0_new center1 = center1_new aa += 1print(len(dis[dis[:,2] == 0]),len(dis[dis[:,2] == 1]))print(center0,center1,aa)

结果如下：

结果分析：

从上面的结果中可以看到，最终的数据被分为的两类，每一类各有50个点。同时我们求出了最终的类中心点，一个是(24,5,124,5)，另一个是(74.5,174.5)，并且还求出了最后的迭代次数为7，也就是说：初始类中心一共迭代了7次后，就不再发生变化了。

c语言sscanf函数的用法是什么

219 2022-11-15

k-means——平面上100个样本点的聚类分析(通俗易懂)

c语言sscanf函数的用法是什么

php怎么获取input输入的值

r语言怎么删除数据表某一个数据

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）