数学建模—聚类(matlab、spss)K均值 Q型聚类 R型聚类

文章目录

  • 一、K均值
  • 二、Q型聚类
  • 三、R型聚类

聚类三种方法: 【说明】 1、三种方式输入矩阵行为个案,列为变量 量纲不同需要预处理,一般使用zscore() zscore()标准化为对每一列操作减去均值除以标准差
2、k均值需要自己确定k取值。Q、R型聚类需要运行完以后再确定选择

一、K均值

  • matlab实现
%% 数据预处理
%如果量纲不同,需要进行预处理,数据的列为属性,行为个案
clear;clc;close all;
data_mean=xlsread('data.xlsx','mean','B3:L16'); %读入数据
data_mean=zscore(data_mean);
%% 判断kmeans的k值
%第二个参数 可以自定义,'linkage','gmdistribution','kmeans'
% eva = evalclusters(data_mean,'kmeans','CalinskiHarabasz','KList',[1:10])    %判断聚类k值 越大越好
% hold on;
% eva = evalclusters(data_mean,'kmeans','DaviesBouldin','KList',[1:10])    %判断聚类k值 越小越好
% hold on;
%eva = evalclusters(data_mean,'kmeans','gap','KList',[1:10])    %判断聚类k值
% hold on;
eva = evalclusters(data_mean,'kmeans','silhouette','KList',[1:10])    %判断聚类k值 越大越好
% hold on;
plot(eva)
%% 根据第一步确定分类
[idx,C,sumd,d]=kmeans(data_mean,3)
%idx表示分类的组别,C表示簇质心的距离,其中第 j 行是簇 j 的质心。
%sumd簇内的点到质心距离的总和,以数值列向量形式返回,d表示从每个点到每个质心的距离,以数值矩阵形式返回
%% 若维度为2维可以画散点图
%catter plot by group,This MATLAB function creates a scatter plot of x and y, grouped by g.
%gscatter(x,y,g)
%由于这个例子数据维数太高没法可视化,提取数据的前两个维度,方便演示
figure
gscatter(data_mean(:,1),data_mean(:,2),idx,'bgm')%画散点
hold on
plot(C(:,1),C(:,2),'kx')%画质心
legend('Cluster 1','Cluster 2','Cluster 3','Cluster Centroid')%添加标签
%3维数据
figure
scatter3(data_mean(:,1),data_mean(:,2),data_mean(:,3),50,idx,'.')
% plot(C(:,1),C(:,2),'kx')%画质心
% legend('Cluster 1','Cluster 2','Cluster 3','Cluster Centroid')%添加标签

  • SPSS实现(默认使用kmeans++)

数据预处理:

模型:


出图:
①判断k的值时的那个图(matlab)
②如果列变量有2个(spss或matlab)或是3个(spss)可以画散点图
Spss中:
首先要保存下分类的类别


二、Q型聚类

对样本(行)进行聚类
Spss实现:


判断类别

即将系数复制到excel



出图:
①判断类别k(spss,matlab)
②聚类图谱(spss)
③如果列变量有2个(spss或matlab)或是3个(spss)可以画散点图

三、R型聚类

对属性(列)进行聚类

出图:
①判断类别k(spss,matlab)
②聚类图谱(spss)
③如果列变量有2个(spss或matlab)或是3个(spss)可以画散点图

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2023年8月17日
下一篇 2023年8月17日

相关推荐