numpy中的converters和usecols用法

用Python打开Excel数据,读取时需要将”学号“和“ID”转换成字符,以便后续操作

df = pd.read_excel(path, converters={'学号': str, 'ID': str})

numpy中的converters和usecols用法

以下是我的亲身经历:

我在从Excel读入python的数据时,发现读出的是空值:

import pandas as pd 
df=pd.read_excel("D:/Python/05DataMineML/2022STU(1).xlsx")
df

numpy中的converters和usecols用法

但是明明有数据,大概率的原因是sheetname(表名)有问题。

然后尝试其他方法:

下图是Excel的表头,共有115行数据。
numpy中的converters和usecols用法
方法一:使用usecols

#获取字段的第一种写法
import pandas as pd
df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',usecols=['学号','姓名','20220101','20220125','20220202','20220208','20220213','20220220','20220226','20220311','20220320','20220327','20220403','randscore'],index_col='姓名',sheet_name='2022STUMOOC')
df.info()

index_col:指定作为表格的索引值
usecols:pandas读取excel使用read_excel()中的usecols参数读取指定的列
sheet_name:表名
numpy中的converters和usecols用法

重点:要使用usecols参数,sheet_name必须显式写出来。
numpy中的converters和usecols用法
方法二:使用numpy

#获取字段的第二种写法:使用numpy
import pandas as pd
import numpy as np
df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',converters={'学号':str},usecols=np.arange(3,16),index_col='姓名',sheet_name='2022STU')
df.head()

这里就涉及converters:

converters={'学号':str}:将学号转换为字符类型,以便后续操作。
numpy中的converters和usecols用法
usecols=np.arange(3,16)在这里用
numpy中的converters和usecols用法

方法三:使用切片间隔

#获取字段的第三种写法:切片区间
import pandas as pd
import numpy as np
df=pd.read_excel('../05DataMineML/2022STUMOOC (1).xlsx',converters={'学号':str},usecols=("D:P"),index_col='姓名',sheet_name='2022STUMOOC')
df

这里使用usecols=("D:P"),即下图中每一列的序号值用于切片
numpy中的converters和usecols用法
numpy中的converters和usecols用法

总结:

  • converters用法:转换类型。比如将Excel数据一列从int变成str
  • usecols用法:
  • usecols=[‘学号’,‘姓名’]
  • usecols=np.arange(3,16)
  • usecols=(“D:P”)

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
心中带点小风骚的头像心中带点小风骚普通用户
上一篇 2022年4月6日 下午1:59
下一篇 2022年4月6日 下午2:12

相关推荐