第三章 数据分析Pandas小结

一.生成数据表

1.导入Pandas库以及numpy库

import numpy as np
import pandas as pd

2.用Pandas创建数据表

d1 = pd.DataFrame(data = np.random.rand(3,4),index = ['a','b','c'],columns=['q','w','e','r']))
d2 = pd.DataFrame(data = np.random.rand(3,4),index = ['a','b','c'],columns=['q','w','e','r']))

index:表示行标签。若不设置该参数,则默认会自动创建一个从0~N的整数索引。

columns:列标签。

二.查看数据表

1、切片

按非连续名称切片

d1[['a','c']]

通过不连续的位置切片

d1[[0,2,4]]

2.Pandas库提供的索引操作

loc:基于标签索引(索引名称),用于按标签选取数据。当执行切片操作时,既包含起始索引,也包含结束索引。

查看一行

d1.loc[['a']]

查看列

d1.loc[:,['q']]

iloc:基于位置索引(整数索引),用于按位置选取数据。当执行切片操作时,只包含起始索引,不包含结束索引。

查看一行

d1.iloc[[0]]

查看列

d1.iloc[:,[0]]

三.数据处理

1.数据增加和删除

添加一列

d1['t']=['1','2','3']

删除一列

del d1['t']

要么

d1.drop(['t'],axis = 1)#drop函数默认删除行,列需要加axis = 1

2.数据表合并

merge

inner取交集

d3=pd.merge(d1,d2,how = 'inner')

outer取并集

d3 = pd.merge(d1,d2,how='outer')

版权声明:本文为博主m0_67698598原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/m0_67698598/article/details/123308933

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2022年3月7日 下午3:07
下一篇 2022年3月7日

相关推荐

此站出售,如需请站内私信或者邮箱!