一.生成数据表
1.导入Pandas库以及numpy库
import numpy as np
import pandas as pd
2.用Pandas创建数据表
d1 = pd.DataFrame(data = np.random.rand(3,4),index = ['a','b','c'],columns=['q','w','e','r']))
d2 = pd.DataFrame(data = np.random.rand(3,4),index = ['a','b','c'],columns=['q','w','e','r']))
index:表示行标签。若不设置该参数,则默认会自动创建一个从0~N的整数索引。
columns:列标签。
二.查看数据表
1、切片
按非连续名称切片
d1[['a','c']]
通过不连续的位置切片
d1[[0,2,4]]
2.Pandas库提供的索引操作
loc:基于标签索引(索引名称),用于按标签选取数据。当执行切片操作时,既包含起始索引,也包含结束索引。
查看一行
d1.loc[['a']]
查看列
d1.loc[:,['q']]
iloc:基于位置索引(整数索引),用于按位置选取数据。当执行切片操作时,只包含起始索引,不包含结束索引。
查看一行
d1.iloc[[0]]
查看列
d1.iloc[:,[0]]
三.数据处理
1.数据增加和删除
添加一列
d1['t']=['1','2','3']
删除一列
del d1['t']
要么
d1.drop(['t'],axis = 1)#drop函数默认删除行,列需要加axis = 1
2.数据表合并
merge
inner取交集
d3=pd.merge(d1,d2,how = 'inner')
outer取并集
d3 = pd.merge(d1,d2,how='outer')
版权声明:本文为博主m0_67698598原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/m0_67698598/article/details/123308933