【python】求多变量/样本(矩阵)之间的相关性系数

创作日志: Pearson或Spearson代表的是两个变量之间的相关性,因此一般输入是两个向量(vector),那么当我们有多个变量时,怎样计算他们两两之间的相关性系数呢?得到的correlation matrix各元素代表的又是什么意思呢?

举例:
矩阵A有两个样本:a1 与 a2,矩阵B有两个样本:b1 与 b2
我们可以利用相关性系数计算函数直接得到 a1 与 b1 、 a2 与 b2 的相关性

import numpy as np

# 创建两个示例矩阵
matrix1 = np.array([[1, 2, 3],
                   [4, 5, 6]])

matrix2 = np.array([[9, 2, 7],
                   [6, 5, 0]])

# 使用NumPy的corrcoef函数计算Pearson相关性系数
correlation_matrix = np.corrcoef(matrix1, matrix2)

print(correlation_matrix)

打印结果:

[[ 1.          1.         -0.2773501  -0.93325653]
 [ 1.          1.         -0.2773501  -0.93325653]
 [-0.2773501  -0.2773501   1.         -0.0862796 ]
 [-0.93325653 -0.93325653 -0.0862796   1.        ]]

结果是一个4×4的矩阵,因为matrix1有两个变量/样本,matrix2有两个变量/样本,共四个样本,每两个样本之间一一对应,包括自身与自身,就形成了4×4,下面是对应关系:


想要哪两个变量/样本之间的相关性系数,直接取对应元素即可。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年11月10日
下一篇 2023年11月10日

相关推荐