Pandas:查询指定数据、数据的详细信息

一、导读

本篇博客主要介绍了Pandas查看和预览数据的常用方法

二、数据

网上随便找的数据集

三、数据查看常用方法

1、读取数据

2、查看数据的大小

数据量(行)、数据指标(列)、数据维度、尺寸

3、获取前/后N条数据

  • 获取前4条数据:
  • head()方法

  • 默认获取前5条数据:
  • 获取后N条数据: 使用tail()函数
  • 默认显示后5条

4、完整展示每个字段的数据

如下图:有些字段的数据被折叠起来,用省略号表示

  • 可以通过设置界面显示的最大列数据量来解决
  • 参数:max_columns
  • 若设置的数大于数据表的列数,则可以完整地展示所有列的内容
  • 比如数据表共有37列数据,我们不妨把数字设置为40


结果:
可以看到之前被折叠的数据已经全部展示出来了

  • 若不知道数据有多少列,参数max_columns的值可以设为None,也可以完整展示所有字段的数据

5、行的数据被折叠

如图:数据表的行数较多时,直接展示的话,部分数据会被折叠起来,用省略号表示

  • 设置最大行参数max_rows的值即可解决
  • pd.options.display.max_rows= None :即展示所有行的数据
  • 若数据量较大,数据全部展示的话,比较耗时间,此时可以选择head()方法来显示前N条数据

四、查看指定条件的数据

1、查询指定字段内容的数据

如图:字段名为”ORGANIZE_NAME”,字段值为“统计班”的数据共有27条,37是指数据表共有37个字段

2、查询条件的叠加

如图:字段名为”ORGANIZE_NAME”,字段值为“统计班”,并且字段”address“为广州的数据共有22条

3、查看指定行/列的数据

(1)查看指定列
  • 查看字段名为 “ORGANIZE_NAME”的前5个内容:
  • 查看字段名为”ORGANIZE_NAME” 和 字段名为“address” 的前5个内容:

(2)查看指定行

【20:30】: 查询的数据范围包含左区间,不包含右区间

(3)查看指定的行和列
  • 使用loc方法
  • loc[20,“ORGANIZE_NAME”]:
    即查看第20行,字段名为“ORGANIZE_NAME ” 的数据

  • 查看字段名为“ORGANIZE_NAME ” 第20到30行的数据
  • 查看多行多列数据:

  • iloc方法:
    • 该方法可以对列进行索引查询,而loc方法不可以对列进行索引查询
    • 查看前5列的第20-30行的数据
  • iat方法:查看指定行和列的数据:
    查询第10行第1列的数据:

等价于:

五、查看数据的详细信息

1、查看数据的详细信息、数据指标的类型

2、统计不同类型数据指标的数量

比如下图:数据类型为 int64 的有2个字段

3、查看数据的详细信息

包括:指标类型统计、数据大小、内存占用信息

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2023年5月24日
下一篇 2023年5月24日

相关推荐