Pandas统计分析基础(2):Pandas之数据的读写(读取csv和excel文件)

✅作者简介:大家好我是Xlong,一枚正在学习COMSOL、Python的工科研究僧
📃个人主页:Xlong的个人博客主页
🔥系列专栏:Python大数据分析
💖如果觉得博主的文章还不错,请👍支持博主🤞

内容

1.数据读写

1.1 读写csv:pd.read_csv和pd.DataFrame.to_csv

1.2 读写excel:pd.read_excel 和 pd.DataFrame.to_excel

1.数据读写

1.1 读写csv:pd.read_csv和pd.DataFrame.to_csv

注意区分pandas和numpy在读写csv方面的区别(下面代码中的‘GDP.csv’文件可私聊博主获取!!!)

(1)错误示范

import numpy as np
gdp_np=np.loadtxt('GDP.csv',delimiter=',')
print(gdp_np)

运行结果:

ValueError: could not convert string to float: ”

显示错误!

(2)正确操作

import numpy as np
gdp_np=np.loadtxt('GDP.csv',delimiter=',',dtype='str')
print(gdp_np)

运行结果:

[[” ‘Beijing’ ‘Tianjin’ ‘Hebei Province’ ‘Shanxi Province’ ‘Inner Mongolia Autonomous Region’ ‘Liaoning Province’ ‘Jilin Province’ ‘Heilongjiang Province’ ‘Shanghai’ ‘Jiangsu Province’
‘Zhejiang Province’ ‘Anhui Province’ ‘Fujian Province’ ‘Jiangxi Province’ ‘Shandong Province’ ‘Henan Province’ ‘Hubei Province’ ‘Hunan Province’ ‘Guangdong Province’ ‘Guangxi Zhuang Autonomous Region’ ‘Hainan Province’
‘Chongqing City’ ‘Sichuan Province’ ‘Guizhou Province’ ‘Yunnan Province’ ‘Tibet Autonomous Region’ ‘Shaanxi Province’ ‘Gansu Province’ ‘Qinghai Province’ ‘Ningxia Hui Autonomous Region’ ‘Xinjiang Uygur Autonomous Region’]
[‘2018年’ ‘30319.98’ ‘18809.64’ ‘36010.27’ ‘16818.11’ ‘17289.22’
‘25315.35’ ‘15074.62’ ‘16361.62’ ‘32679.87’ ‘92595.4’ ‘56197.15’
‘30006.82’ ‘35804.04’ ‘21984.78’ ‘76469.67’ ‘48055.86’ ‘39366.55’
‘36425.78’ ‘97277.77’ ‘20352.51’ ‘4832.05’ ‘20363.19’ ‘40678.13’
‘14806.45’ ‘17881.12’ ‘1477.63’ ‘24438.32’ ‘8246.07’ ‘2865.23’
‘3705.18’ ‘12199.08’]
[‘2017年’ ‘28014.94’ ‘18549.19’ ‘34016.32’ ‘15528.42’ ‘16096.21’
‘23409.24’ ‘14944.53’ ‘15902.68’ ‘30632.99’ ‘85869.76’ ‘51768.26’
‘27018’ ‘32182.09’ ‘20006.31’ ‘72634.15’ ‘44552.83’ ‘35478.09’
‘33902.96’ ‘89705.23’ ‘18523.26’ ‘4462.54’ ‘19424.73’ ‘36980.22’
‘13540.83’ ‘16376.34’ ‘1310.92’ ‘21898.81’ ‘7459.9’ ‘2624.83’ ‘3443.56’
‘10881.96’]
[‘2016年’ ‘25669.13’ ‘17885.39’ ‘32070.45’ ‘13050.41’ ‘18128.1’ ‘22246.9’
‘14776.8’ ‘15386.09’ ‘28178.65’ ‘77388.28’ ‘47251.36’ ‘24407.62’
‘28810.58’ ‘18499’ ‘68024.49’ ‘40471.79’ ‘32665.38’ ‘31551.37’
‘80854.91’ ‘18317.64’ ‘4053.2’ ‘17740.59’ ‘32934.54’ ‘11776.73’
‘14788.42’ ‘1151.41’ ‘19399.59’ ‘7200.37’ ‘2572.49’ ‘3168.59’ ‘9649.7’]
[‘2015年’ ‘23014.59’ ‘16538.19’ ‘29806.11’ ‘12766.49’ ‘17831.51’
‘28669.02’ ‘14063.13’ ‘15083.67’ ‘25123.45’ ‘70116.38’ ‘42886.49’
‘22005.63’ ‘25979.82’ ‘16723.78’ ‘63002.33’ ‘37002.16’ ‘29550.19’
‘28902.21’ ‘72812.55’ ‘16803.12’ ‘3702.76’ ‘15717.27’ ‘30053.1’
‘10502.56’ ‘13619.17’ ‘1026.39’ ‘18021.86’ ‘6790.32’ ‘2417.05’
‘2911.77’ ‘9324.8’]
[‘2014年’ ‘21330.83’ ‘15726.93’ ‘29421.15’ ‘12761.49’ ‘17770.19’
‘28626.58’ ‘13803.14’ ‘15039.38’ ‘23567.7’ ‘65088.32’ ‘40173.03’
‘20848.75’ ‘24055.76’ ‘15714.63’ ‘59426.59’ ‘34938.24’ ‘27379.22’
‘27037.32’ ‘67809.85’ ‘15672.89’ ‘3500.72’ ‘14262.6’ ‘28536.66’
‘9266.39’ ‘12814.59’ ‘920.83’ ‘17689.94’ ‘6836.82’ ‘2303.32’ ‘2752.1’
‘9273.46’]
[‘2013年’ ‘19800.81’ ‘14442.01’ ‘28442.95’ ‘12665.25’ ‘16916.5’
‘27213.22’ ‘13046.4’ ‘14454.91’ ‘21818.15’ ‘59753.37’ ‘37756.59’
‘19229.34’ ‘21868.49’ ‘14410.19’ ‘55230.32’ ‘32191.3’ ‘24791.83’
‘24621.67’ ‘62474.79’ ‘14449.9’ ‘3177.56’ ‘12783.26’ ‘26392.07’
‘8086.86’ ‘11832.31’ ‘815.67’ ‘16205.45’ ‘6330.69’ ‘2122.06’ ‘2577.57’
‘8443.84’]
[‘2012年’ ‘17879.4’ ‘12893.88’ ‘26575.01’ ‘12112.83’ ‘15880.58’
‘24846.43’ ‘11939.24’ ‘13691.58’ ‘20181.72’ ‘54058.22’ ‘34665.33’
‘17212.05’ ‘19701.78’ ‘12948.88’ ‘50013.24’ ‘29599.31’ ‘22250.45’
‘22154.23’ ‘57067.92’ ‘13035.1’ ‘2855.54’ ‘11409.6’ ‘23872.8’ ‘6852.2’
‘10309.47’ ‘701.03’ ‘14453.68’ ‘5650.2’ ‘1893.54’ ‘2341.29’ ‘7505.31’]
[‘2011年’ ‘16251.93’ ‘11307.28’ ‘24515.76’ ‘11237.55’ ‘14359.88’
‘22226.7’ ‘10568.83’ ‘12582’ ‘19195.69’ ‘49110.27’ ‘32318.85’
‘15300.65’ ‘17560.18’ ‘11702.82’ ‘45361.85’ ‘26931.03’ ‘19632.26’
‘19669.56’ ‘53210.28’ ‘11720.87’ ‘2522.66’ ‘10011.37’ ‘21026.68’
‘5701.84’ ‘8893.12’ ‘605.83’ ‘12512.3’ ‘5020.37’ ‘1670.44’ ‘2102.21’
‘6610.05’]
[‘2010年’ ‘14113.58’ ‘9224.46’ ‘20394.26’ ‘9200.86’ ‘11672’ ‘18457.27’
‘8667.58’ ‘10368.6’ ‘17165.98’ ‘41425.48’ ‘27722.31’ ‘12359.33’
‘14737.12’ ‘9451.26’ ‘39169.92’ ‘23092.36’ ‘15967.61’ ‘16037.96’
‘46013.06’ ‘9569.85’ ‘2064.5’ ‘7925.58’ ‘17185.48’ ‘4602.16’ ‘7224.18’
‘507.46’ ‘10123.48’ ‘4120.75’ ‘1350.43’ ‘1689.65’ ‘5437.47’]
[‘2009年’ ‘12153.03’ ‘7521.85’ ‘17235.48’ ‘7358.31’ ‘9740.25’ ‘15212.49’
‘7278.75’ ‘8587’ ‘15046.45’ ‘34457.3’ ‘22990.35’ ‘10062.82’ ‘12236.53’
‘7655.18’ ‘33896.65’ ‘19480.46’ ‘12961.1’ ‘13059.69’ ‘39482.56’
‘7759.16’ ‘1654.21’ ‘6530.01’ ‘14151.28’ ‘3912.68’ ‘6169.75’ ‘441.36’
‘8169.8’ ‘3387.56’ ‘1081.27’ ‘1353.31’ ‘4277.05’]
[‘2008年’ ‘11115’ ‘6719.01’ ‘16011.97’ ‘7315.4’ ‘8496.2’ ‘13668.58’
‘6426.1’ ‘8314.37’ ‘14069.86’ ‘30981.98’ ‘21462.69’ ‘8851.66’
‘10823.01’ ‘6971.05’ ‘30933.28’ ‘18018.53’ ‘11328.92’ ‘11555’
‘36796.71’ ‘7021’ ‘1503.06’ ‘5793.66’ ‘12601.23’ ‘3561.56’ ‘5692.12’
‘394.85’ ‘7314.58’ ‘3166.82’ ‘1018.62’ ‘1203.92’ ‘4183.21’]
[‘2007年’ ‘9846.81’ ‘5252.76’ ‘13607.32’ ‘6024.45’ ‘6423.18’ ‘11164.3’
‘5284.69’ ‘7104’ ‘12494.01’ ‘26018.48’ ‘18753.73’ ‘7360.92’ ‘9248.53’
‘5800.25’ ‘25776.91’ ‘15012.46’ ‘9333.4’ ‘9439.6’ ‘31777.01’ ‘5823.41’
‘1254.17’ ‘4676.13’ ‘10562.39’ ‘2884.11’ ‘4772.52’ ‘341.43’ ‘5757.29’
‘2703.98’ ‘797.35’ ‘919.11’ ‘3523.16’]
[‘2006年’ ‘8117.78’ ‘4462.74’ ‘11467.6’ ‘4878.61’ ‘4944.25’ ‘9304.52’
‘4275.12’ ‘6211.8’ ‘10572.24’ ‘21742.05’ ‘15718.47’ ‘6112.5’ ‘7583.85’
‘4820.53’ ‘21900.19’ ‘12362.79’ ‘7617.47’ ‘7688.67’ ‘26587.76’
‘4746.16’ ‘1065.67’ ‘3907.23’ ‘8690.24’ ‘2338.98’ ‘3988.14’ ‘290.76’
‘4743.61’ ‘2277.35’ ‘648.5’ ‘725.9’ ‘3045.26’]
[‘2005年’ ‘6969.52’ ‘3905.64’ ‘10012.11’ ‘4230.53’ ‘3905.03’ ‘8047.26’
‘3620.27’ ‘5513.7’ ‘9247.66’ ‘18598.69’ ‘13417.68’ ‘5350.17’ ‘6554.69’
‘4056.76’ ‘18366.87’ ‘10587.42’ ‘6590.19’ ‘6596.1’ ‘22557.37’ ‘3984.1’
‘918.75’ ‘3467.72’ ‘7385.1’ ‘2005.42’ ‘3462.73’ ‘248.8’ ‘3933.72’
‘1933.98’ ‘543.32’ ‘612.61’ ‘2604.19’]
[‘2004年’ ‘6033.21’ ‘3110.97’ ‘8477.63’ ‘3571.37’ ‘3041.07’ ‘6672’
‘3122.01’ ‘4750.6’ ‘8072.83’ ‘15003.6’ ‘11648.7’ ‘4759.3’ ‘5763.35’
‘3456.7’ ‘15021.84’ ‘8553.79’ ‘5633.24’ ‘5641.94’ ‘18864.62’ ‘3433.5’
‘819.66’ ‘3034.58’ ‘6379.63’ ‘1677.8’ ‘3081.91’ ‘220.34’ ‘3175.58’
‘1688.49’ ‘466.1’ ‘537.11’ ‘2209.09’]
[‘2003年’ ‘5007.21’ ‘2578.03’ ‘6921.29’ ‘2855.23’ ‘2388.38’ ‘6002.54’
‘2662.08’ ‘4057.4’ ‘6694.23’ ‘12442.87’ ‘9705.02’ ‘3923.11’ ‘4983.67’
‘2807.41’ ‘12078.15’ ‘6867.7’ ‘4757.45’ ‘4659.99’ ‘15844.64’ ‘2821.11’
‘713.96’ ‘2555.72’ ‘5333.09’ ‘1426.34’ ‘2556.02’ ‘185.09’ ‘2587.72’
‘1399.83’ ‘390.2’ ‘445.36’ ‘1886.35’]
[‘2002年’ ‘4315’ ‘2150.76’ ‘6018.28’ ‘2324.8’ ‘1940.94’ ‘5458.22’
‘2348.54’ ‘3637.2’ ‘5741.03’ ‘10606.85’ ‘8003.67’ ‘3519.72’ ‘4467.55’
‘2450.48’ ‘10275.5’ ‘6035.48’ ‘4212.82’ ‘4151.54’ ‘13502.42’ ‘2523.73’
‘642.73’ ‘2232.86’ ‘4725.01’ ‘1243.43’ ‘2312.82’ ‘162.04’ ‘2253.39’
‘1232.03’ ‘340.65’ ‘377.16’ ‘1612.65’]
[‘2001年’ ‘3707.96’ ‘1919.09’ ‘5516.76’ ‘2029.53’ ‘1713.81’ ‘5033.08’
‘2120.35’ ‘3390.1’ ‘5210.12’ ‘9456.84’ ‘6898.34’ ‘3246.71’ ‘4072.85’
‘2175.68’ ‘9195.04’ ‘5533.01’ ‘3880.53’ ‘3831.9’ ‘12039.25’ ‘2279.34’
‘579.17’ ‘1976.86’ ‘4293.49’ ‘1133.27’ ‘2138.31’ ‘139.16’ ‘2010.62’
‘1125.37’ ‘300.13’ ‘337.44’ ‘1491.6’]
[‘2000年’ ‘3161.66’ ‘1701.88’ ‘5043.96’ ‘1845.72’ ‘1539.12’ ‘4669.06’
‘1951.51’ ‘3151.4’ ‘4771.17’ ‘8553.69’ ‘6141.03’ ‘2902.09’ ‘3764.54’
‘2003.07’ ‘8337.47’ ‘5052.99’ ‘3545.39’ ‘3551.49’ ‘10741.25’ ‘2080.04’
‘526.82’ ‘1791’ ‘3928.2’ ‘1029.92’ ‘2011.19’ ‘117.8’ ‘1804’ ‘1052.88’
‘263.68’ ‘295.02’ ‘1363.56’]]

Process finished with exit code 0

注意:numpy在读csv文件时,是将csv文件读作一个数组,数组要求其中的每一个元素都是相同的数据类型。因此,当有文字内容时,得读作str类型

import numpy as np
gdp_pd=pd.read_csv('GDP.csv')
print(gdp_pd)

运行结果:

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb1 in position 1: invalid start byte

import numpy as np
gdp_pd=pd.read_csv('GDP.csv',encoding='gbk')
print(gdp_pd)

运行结果:

Unnamed: 0       北京市       天津市  …      青海省  宁夏回族自治区  新疆维吾尔自治区
0       2018年  30319.98  18809.64  …  2865.23  3705.18  12199.08
1       2017年  28014.94  18549.19  …  2624.83  3443.56  10881.96
2       2016年  25669.13  17885.39  …  2572.49  3168.59   9649.70
3       2015年  23014.59  16538.19  …  2417.05  2911.77   9324.80
4       2014年  21330.83  15726.93  …  2303.32  2752.10   9273.46
5       2013年  19800.81  14442.01  …  2122.06  2577.57   8443.84
6       2012年  17879.40  12893.88  …  1893.54  2341.29   7505.31
7       2011年  16251.93  11307.28  …  1670.44  2102.21   6610.05
8       2010年  14113.58   9224.46  …  1350.43  1689.65   5437.47
9       2009年  12153.03   7521.85  …  1081.27  1353.31   4277.05
10      2008年  11115.00   6719.01  …  1018.62  1203.92   4183.21
11      2007年   9846.81   5252.76  …   797.35   919.11   3523.16
12      2006年   8117.78   4462.74  …   648.50   725.90   3045.26
13      2005年   6969.52   3905.64  …   543.32   612.61   2604.19
14      2004年   6033.21   3110.97  …   466.10   537.11   2209.09
15      2003年   5007.21   2578.03  …   390.20   445.36   1886.35
16      2002年   4315.00   2150.76  …   340.65   377.16   1612.65
17      2001年   3707.96   1919.09  …   300.13   337.44   1491.60
18      2000年   3161.66   1701.88  …   263.68   295.02   1363.56

[19 rows x 32 columns]

import numpy as np
gdp_pd=pd.read_csv('GDP.csv',encoding='gbk')
#print(gdp_pd)
print(gdp_pd.index)

运行结果:

RangeIndex(start=0, stop=19, step=1)

默认情况下,会自动生成index,从0开始的数字

如果csv里有填好的index,可以通过index_col参数指定

import numpy as np
gdp_pd=pd.read_csv('GDP.csv',encoding='gbk',index_col=0)
print(gdp_pd)

运行结果:

Beijing Municipality Tianjin Municipality Hebei Province … Qinghai Province Ningxia Hui Autonomous Region Xinjiang Uygur Autonomous Region
2018年  30319.98  18809.64  36010.27  …  2865.23  3705.18  12199.08
2017年  28014.94  18549.19  34016.32  …  2624.83  3443.56  10881.96
2016年  25669.13  17885.39  32070.45  …  2572.49  3168.59   9649.70
2015年  23014.59  16538.19  29806.11  …  2417.05  2911.77   9324.80
2014年  21330.83  15726.93  29421.15  …  2303.32  2752.10   9273.46
2013年  19800.81  14442.01  28442.95  …  2122.06  2577.57   8443.84
2012年  17879.40  12893.88  26575.01  …  1893.54  2341.29   7505.31
2011年  16251.93  11307.28  24515.76  …  1670.44  2102.21   6610.05
2010年  14113.58   9224.46  20394.26  …  1350.43  1689.65   5437.47
2009年  12153.03   7521.85  17235.48  …  1081.27  1353.31   4277.05
2008年  11115.00   6719.01  16011.97  …  1018.62  1203.92   4183.21
2007年   9846.81   5252.76  13607.32  …   797.35   919.11   3523.16
2006年   8117.78   4462.74  11467.60  …   648.50   725.90   3045.26
2005年   6969.52   3905.64  10012.11  …   543.32   612.61   2604.19
2004年   6033.21   3110.97   8477.63  …   466.10   537.11   2209.09
2003年   5007.21   2578.03   6921.29  …   390.20   445.36   1886.35
2002年   4315.00   2150.76   6018.28  …   340.65   377.16   1612.65
2001年   3707.96   1919.09   5516.76  …   300.13   337.44   1491.60
2000年   3161.66   1701.88   5043.96  …   263.68   295.02   1363.56

[19 rows x 31 columns]

import pandas as pd
gdp_pd=pd.read_csv('GDP.csv',encoding='gbk',index_col=0)
#print(gdp_pd)
print(gdp_pd.index)

运行结果:

Index([‘2018年’, ‘2017年’, ‘2016年’, ‘2015年’, ‘2014年’, ‘2013年’, ‘2012年’, ‘2011年’,
‘2010年’, ‘2009年’, ‘2008年’, ‘2007年’, ‘2006年’, ‘2005年’, ‘2004年’, ‘2003年’,
‘2002年’, ‘2001年’, ‘2000年’],
dtype=’object’)

gdp_pd.to_csv('another_gdp.csv') #默认会保存行名和列名

注意:默认保存的编码是utf-8,但excel读取的默认编码是gbk,所以会出现乱码。可以在保存时指定编码解决。

gdp_pd.to_csv('another_gdp.csv',encoding='gbk') #默认会保存行名和列名

注意:只有Dataframe对象才有to_csv这个功能,ndarray不可以

import pandas as pd
gdp_pd=pd.read_csv('GDP.csv',encoding='gbk',index_col=0)
print(type(gdp_pd))

运行结果:

pip update pandas用于更新pandas包

没权限的就用管理员身份运行cmd

1.2 读写excel:pd.read_excel 和 pd.DataFrame.to_excel

(下面代码中的‘GDPandPopulation.xlsx’文件可私聊博主获取!!!)

import pandas as pd
gdpandpop_excel=pd.read_excel('GDPandPopulation.xlsx')
print(gdpandpop_excel)

运行结果:

Missing optional dependency ‘openpyxl’.  Use pip or conda to install openpyxl.

我们发现:在使用pandas导入文件数据的时候,运行read_csv正常,运行的read_excel 出现错误,直接按照提示安装openpyxl。

解决方案:

Pandas统计分析基础(2):Pandas之数据的读写(读取csv和excel文件)

左上角 File–>Settings—>project –>Python interpreter –>+号搜索安装openpyxl–>Install Package

再次运行如下:

Unnamed: 0       北京市       天津市  …      青海省  宁夏回族自治区  新疆维吾尔自治区
0       2018年  30319.98  18809.64  …  2865.23  3705.18  12199.08
1       2017年  28014.94  18549.19  …  2624.83  3443.56  10881.96
2       2016年  25669.13  17885.39  …  2572.49  3168.59   9649.70
3       2015年  23014.59  16538.19  …  2417.05  2911.77   9324.80
4       2014年  21330.83  15726.93  …  2303.32  2752.10   9273.46
5       2013年  19800.81  14442.01  …  2122.06  2577.57   8443.84
6       2012年  17879.40  12893.88  …  1893.54  2341.29   7505.31
7       2011年  16251.93  11307.28  …  1670.44  2102.21   6610.05
8       2010年  14113.58   9224.46  …  1350.43  1689.65   5437.47
9       2009年  12153.03   7521.85  …  1081.27  1353.31   4277.05
10      2008年  11115.00   6719.01  …  1018.62  1203.92   4183.21
11      2007年   9846.81   5252.76  …   797.35   919.11   3523.16
12      2006年   8117.78   4462.74  …   648.50   725.90   3045.26
13      2005年   6969.52   3905.64  …   543.32   612.61   2604.19
14      2004年   6033.21   3110.97  …   466.10   537.11   2209.09
15      2003年   5007.21   2578.03  …   390.20   445.36   1886.35
16      2002年   4315.00   2150.76  …   340.65   377.16   1612.65
17      2001年   3707.96   1919.09  …   300.13   337.44   1491.60
18      2000年   3161.66   1701.88  …   263.68   295.02   1363.56

[19 rows x 32 columns]

在不指明sheetname的时候,会读取Excel里排在第一个的sheet,要注意!

import pandas as pd
population=pd.read_excel('GDPandPopulation.xlsx',sheet_name='Population',index_col=0)
print(population)

运行结果:

Beijing Tianjin City Hebei Province Shanxi Province Inner Mongolia Autonomous Region … Shaanxi Province Gansu Province Qinghai Province Ningxia Hui Autonomous Region Xinjiang Uygur Autonomous Region
2018年  2154  1560  7556  3718    2534  …  3864  2637  603      688      2487
2017年  2171  1557  7520  3702    2529  …  3835  2626  598      682      2445
2016年  2173  1562  7470  3682    2520  …  3813  2610  593      675      2398
2015年  2171  1547  7425  3664    2511  …  3793  2600  588      668      2360
2014年  2152  1517  7384  3648    2505  …  3775  2591  583      662      2298
2013年  2115  1472  7333  3630    2498  …  3764  2582  578      654      2264
2012年  2069  1413  7288  3611    2490  …  3753  2578  573      647      2233
2011年  2019  1355  7241  3593    2482  …  3743  2564  568      639      2209
2010年  1962  1299  7194  3574    2472  …  3735  2560  563      633      2185
2009年  1860  1228  7034  3427    2458  …  3727  2555  557      625      2159
2008年  1771  1176  6989  3411    2444  …  3718  2551  554      618      2131
2007年  1676  1115  6943  3393    2429  …  3708  2548  552      610      2095
2006年  1601  1075  6898  3375    2415  …  3699  2547  548      604      2050
2005年  1538  1043  6851  3355    2403  …  3690  2545  543      596      2010
2004年  1493  1024  6809  3335    2393  …  3681  2541  539      588      1963
2003年  1456  1011  6769  3314    2386  …  3672  2537  534      580      1934
2002年  1423  1007  6735  3294    2384  …  3662  2531  529      572      1905
2001年  1385  1004  6699  3272    2381  …  3653  2523  523      563      1876
2000年  1364  1001  6674  3247    2372  …  3644  2515  517      554      1849

[19 rows x 31 columns]

import pandas as pd
population=pd.read_excel('GDPandPopulation.xlsx',sheet_name='Population',index_col=0)
#print(population)
print(type(population))

运行结果:

import pandas as pd
population=pd.read_excel('GDPandPopulation.xlsx',sheet_name='Population',index_col=0)
gdp=pd.read_excel('GDPandPopulation.xlsx',sheet_name='GDP',index_col=0)
#要注意,使用to_excel时,文件名必须是xlsx或者xls等excel的专用文件名
population.to_excel('p.xlsx',sheet_name='pop')
#直接使用Dataframe.to_excel(),会把之前的excel文件替换掉,即使设了不同的sheet_name也不行
gdp.to_excel('g.xlsx',sheet_name='gdp')

运行结果:

生成’p.xlsx’和’g.xlsx’两个数据文件,分别存放population和gdp数据

注意:想要将多个sheet保存到excel中,必须通过excelwriter对象来传递文件路径

import pandas as pd
population=pd.read_excel('GDPandPopulation.xlsx',sheet_name='Population',index_col=0)
gdp=pd.read_excel('GDPandPopulation.xlsx',sheet_name='GDP',index_col=0)
excel=pd.ExcelWriter('output.xlsx')  #生成excel_writer对象
gdp.to_excel(excel,sheet_name='gdp')  #把之前输入文件名的位置替换成excel_writer对象
population.to_excel(excel,sheet_name='pop')
excel.save() #运行后才会生成output.xlsx文件

运行结果:

生成’output.xlsx’文件,存储两个sheet到Excel中。这两个sheet分别存放population和gdp数据

以上就是Pandas统计分析基础(2)Pandas之数据的读写,如果有改进的建议,欢迎在评论区留言交流~

持续更新中……原创不易,各位看官请随手点下Follow和Star,感谢!!!

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2022年3月18日 下午3:11
下一篇 2022年3月18日

相关推荐