r语言相关性分析_R语言数据分析系列相关性

相关性分析

相关性是指两个变量的关联程度,两个随机变量之间的关系可以用相关系数来描述。相关系数的大小表示两者关系的强弱程度(若系数等于0则完全不相关,系数绝对值等于1表明完全相关),相关系数的正负值表示两者关系呈正相关或负相关。 衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数和kendall相关系数。在本案例中,主要涉及的是pearson相关系数。笔者接下来将讲解如何通过R语言软件来实现变量间的相关性的统计计算,并绘制几种时下较为常用的相关性图形供大家学习参考,希望各位老师同行可以多多指点。

跟往常一样,我们在进行相关性分析之前,首先先准备好我们所需的数据。本次我们下载了GEO数据库的数据,该数据库也是一个常用的公共数据库。在R语言中,我们读取并查看数据前6行,我们可以看到,该数据以行对应每个样本,以列对应每个基因的表达, 如下:

40e2aec29df43017aec6c23b61d4c434.png

在R语言本身是就带有计算相关性的函数cor.test,因此我们可以直接用该函数计算任意两个基因之间的相关性,结果如下:

d1fb33dee2fda4a70b3c64a74d533015.png

我们从以上结果得知,PTEN和Gli基因的相关性系数达到0.356,呈正相关,并且p值小于0.05,表明显著相关。以此类推,我们也可以计算其他基因之间的相关性。

图形能够更加直观地表达两者之间的关系,因此我们可以选择相关性散点图,鉴于ggplot2在绘图方面的表现能力独一档,本次就使用该包来绘制相关性散点图。代码如下:

86924d67ab0f8eec845db5ec34cd46b8.png

1d4d132d79da9012379956e18f96a3d8.png

上图中,我们可以看到两种基因的表达情况之间的相关性,随着PTEN的表达升高,Gli的表达也同样呈上升趋势,因此两者具有正相关性。但我们也发现,图中缺乏相关性系数和p值,因此我们通过以下代码可以实现对两种参数的添加。代码如下:

0376d3597941de0189d69a0419a9a2a2.png

16fd1cc8195bc2e67d8c699ad7dbff3e.png

以上只是提到如何进行其中两种基因的相关性分析,但如果我们想探索PTEN与其他基因之间的相关性分析,就要改代码进行进一步的计算,我们想到,R语言中可以进行循环计算。在此,我们编写for循环函数,对每个基因与PTEN的表达相关性进行分析并绘制相关性散点图,代码如下:

7ead2632db9a46e5a498af1049dd67bb.png

d473262936490675d016508a86669335.png

我们对每个基因都与PTEN进行了相关性分析,并将相关性散点图输出到工作目录中。

其实,以上也不是最简单的方法,数据科学家早就想到了大家的需求。以下将介绍在R语言中两种更加简单的方法:

1. PerformanceAnalytics包

0ed73471e858e3e651b923e05547b099.png

    通过以上,简单的代码,我们即可得到如下结果,其中数字表示相关性系数,星号代表统计学显著性,星号越多,p值越小。

5063652982ee6d135b4c6a9ed87e4a93.png

2.Corrplot包

3e5f7fd2a98c09a2f61aafb36f43a9b3.png

Corrplot是另一种进行批量分析的方法,我们可以得到相关性热图,其中颜色的深浅代表相关性系数的大小,结果如下:

6e36610dfd2975b3874dd080ec58cf6d.png

当然,我们也可以对其中的参数进行进一步修改,使图形更具可读性,如下:

c0cd8a91ff2a90b1e3f1ae1ba7ee829b.png

5f33cf71d0f8590bfc4f0b6fa581e02c.png

这样的图形可能会更加美观一点。或者,我们还可以试着其他调整:

e18514773688b868ed48b1ffe34576fb.png

877bda892cc3fbd5a3cd5ccc5acad3d4.png

总之,在R语言中,我们可以利用多种方法对数据中的变量进行相关性分析。如果我们对其中某两个变量的相关性感兴趣,就可以利用先前讲到的ggplot2,如果我们想探索所有基因的相关性,那我们就可以利用corrplot或者PerformanceAnalytics了。

————————————————————————————————————————————

好了,今天的内容就跟大家分享到这里吧,如果大家感兴趣的话,可以加笔者的企鹅获取完整代码或做进一步的交流,谢谢!

e6accd14a7a35c40978a8bb5c36c8f3d.png

或者关注我们的微信订阅号,关注即可获得我们完整的代码,我们后续还会不定时发布最新的内容供大家学习参考,谢谢支持!!!

e8637b10e75e1894bd88552fc72c7f37.png

版权声明:本文为博主作者:想学习的小蔡原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/m0_46047369/article/details/135089072

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
xiaoxingxing的头像xiaoxingxing管理团队
上一篇 2024年4月22日
下一篇 2024年4月22日

相关推荐