【R语言数据分析】基于R语言对中、美两国GDP分析(R语言大作业)

目录


 一、研究意义

GDP作为衡量一个国家经济发展的重要指标,被赋予了非常重要的意义,深刻反映着当下经济发展的现状。中美作为当今世界前两大经济体,在世界经济上有着极大占比并且主导着世界经济的走向。我将两国近十几年GDP进行研究建模模拟预测未来两国GDP的发展趋势从而分析出世界经济格局的变化。

二、数据来源

中经数据CEIdata(https://ceidata.cei.cn/)

三、读取数据

数据为csv文件,大家自行复制,单位均为亿美元。

美国GDP如下:

timeusa
2005130366.4
2006138146.1
2007144518.6
2008147128.5
2009144489.3
2010149920.5
2011155425.8
2012161970.1
2013167848.5
2014175271.6
2015182383
2016187450.8
2017194796.2
2018205271.6
2019213725.7
2020208937.4
2021229961

中国GDP如下:

timeCN
200522859.66
200627521.32
200735503.43
200845943.07
200951017.03
201060871.64
201175515
201285322.3
201395704.07
2014104756.8
2015110615.5
2016112332.8
2017123104.1
2018138948.2
2019142799.4
2020146876.7
2021177340.6

读取数据代码

GDP1<-read.csv("CNGDP1.csv",header = TRUE)#中国GDP
GDP2<-read.csv("USGDP1.csv",header = TRUE)#美国GDP
GDP1
GDP2

运行结果截图

 

 四、数据分析绘制箱线图

建立箱线图代码

boxplot(GDP1[,2],GDP2[,2],names = c("中国GDP","美国GDP"),col = colors()[10:11],main="中国、美国 2005-2021 年GDP箱线图",ylab="GDP总量(亿美元)")

运行结果截图 

从图中可以看出,没有异常值。

五、建立回归模型

通过建立回归模型从而推导出回归方程,利用回归方程中的数值对中国和美国两国未来几十年GDP的走势进行预测,找到转折点,对未来世界的经济走势进行预测。

建立回归模型代码

#线性回归分析
#数据分析,确定回归方程
GDP1 <- ts(GDP1,start = 2005)
GDP2 <- ts(GDP2,start = 2005)
library(car)
#首先确定年份和中国GDP的关系:
scatterplot(GDP1[,2]~GDP1[,1],ylim=c(0,200000),data = GDP1,pch = 19,xlab = "年份",ylab="中国历年GDP值(亿)",cex.lab=0.8)
#确定年份和美国GDP的关系:
scatterplot(GDP2[,2]~GDP2[,1],ylim=c(130000,230000),data = GDP2,pch = 19,xlab = "年份",ylab="美国历年GDP值",cex.lab=0.8)

 运行结果截图

  • 随着年份增加,中国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示中国的GDP值对称分布。
  • 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。

  • 随着年份增加,美国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示美国的GDP值基本上呈对称分布。
  • 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。

有关于相关系数的计算与检验

cor(GDP1[,1],GDP1[,2])#中国

r=0.9939131相关性很强的正线性相关 

cor(GDP2[,2],GDP2[,1])#美国

#r=0.9840649 相关性很强的正线性相关 

 六、回归分析

确定回归方程

x1 <- GDP1[,1]
y1 <- GDP1[,2]
y2 <- GDP2[,2]
model1 <- lm(y1~x1) 
model2 <- lm(y2~x1) 
summary(model1) 

根据 summary() 函数展示的 model1(年份和中国GDP值)回归拟合的详细结果,可以计算出回归方程:y=9099×年份-18230000

summary(model2) # 展示拟合的详细结果

根据 summary() 函数展示的 model2(年份和美国GDP值)回归拟合的详细结果,可以计算出回归方程:y=5823×年份-11570000

七、预测中国美国未来的GDP值、预测中国的GDP赶超美国的时间

m <- 1
data1 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
data2 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
for(i in 2022:2080){
    a5 <- data.frame(x1=i)
    result1 <- predict(model1,a5)
    result2 <- predict(model2,a5)
    data1[m,1] <- i
    data1[m,2] <- result1
    data2[m,1] <- i
    data2[m,2] <- result2
    m <- m+1
}
data1
data2

    

左图为未来中国GDP预测,有图为未来美国GDP预测,在截图中我只展示了35年以后的预测结果,其中我们可以看出来以纯数据形式展现,观察发现可知,预计2038年时,中国GDP超过美国。

数据可视化

data1 <- ts(data1,start = 2019) # 建立时间序列
data2 <- ts(data2,start = 2019) # 建立时间序列
plot(data1[,2],ylim=c(0,710000),lwd=2,xlab="年份",ylab="GDP总值(亿)",main="预测2022-2080年度中国、美国GDP总值趋势图",type="n")
grid(col = "black")
lines(data1[,2],type="l",lwd=3,col="red")
lines(data2[,2],type="l",lwd=3,lty=10,col="blue")
legend(x="topleft",legend = c("中国GDP总值","美国GDP总值"),lty=1:4,col=c("red","blue"))

 

八、总结

通过模型计算我国GDP将在2038年超越美国。彼时世界经济中心向欧亚大陆的回归,几千年来世界第一强国一直都是亚欧大陆的国家。只有近100多年来是一个例外,被北美大陆的国家美国占据了世界第一强国的位置。国民生活水平很有可能会有一次大幅提升,中国将快速收割全球优质资产和廉价原料。至于政治地位,需要一个漫长的过程,全球很可能进入一个两主共治的局面

 

 

 

 

 

 

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
心中带点小风骚的头像心中带点小风骚普通用户
上一篇 2023年12月22日
下一篇 2023年12月22日

相关推荐