一、选择题

1、关于标准差标准化，下列说法中错误的是(B)。
A. 经过该方法处理后的数据均值为0，标准差为1
B. 可能会改变数据的分布情况
C.Python中可自定义该方法实现函数:
def StandardScaler(data):
data=(data-data.mean())/data.std()
return data
D. 计算公式为X*=(X-`X)/σ

2、使用 pivot_table 函数制作透视表用下列(A)参数设置行分组键。
A. index
B. raw
C. values
D. data

3、下列 loc、iloc、ix 属性的用法正确的是(D)
A. df.loc[‘列名’,‘索引名’];df.iloc[‘索引位置’,‘列位置’];df.ix[‘索引位置’, ‘列名’]
B. df.loc[‘索引名’,‘列名’];df.iloc[‘索引位置’,‘列名’];df.ix[‘索引位置’, ‘列名’]
C. df.loc[‘索引名’,‘列名’];df.iloc[‘索引位置’,‘列名’];df.ix[‘索引名’, ‘列位置’]
D. df.loc[‘索引名’,‘列名’];df.iloc[‘索引位置’,‘列位置’];df.ix[‘索引位置’, ‘列位置’]

4、以下最能体现ufunc 函数特点的是(C)
A. 又叫通用函数
B. 对数组里的每一个元素逐一操作
C. 对整个数组进行操作
D. 数组里的元素都是相同类型的

5、使用其本身可以达到数据透视功能的函数是(D)
A. groupby
B. transform
C. cosstab
D. pivot_table

6、以下关于数据分析预处理的过程描述正确的是(C)。
A. 数据清洗包含了数据标准化、数据合并和缺失值处理
B. 数据合并按照合并轴方向主要分为左连接、右连接、内连接和外连接
C. 预处理过程主要包括数据清洗、数据合并、数据标准化和数据转换，它们之间存在交叉，没有严格的先后关系
D. 数据标准化的主要对象是类别型的特征

7、以下关于pandas数据预处理说法正确的是(D)。
A. pandas没有做哑变量的函数
B. 在不导人其他库的情况下，仅仅使用pandas 就可实现聚类分析离散化
C. pandas 可以实现所有的数据预处理操作
D. cut 函数默认情况下做的是等宽法离散化

8、以下关于drop_duplicates函数的说法中错误的是(B)。
A. 仅对 DataFrame 和 Series 类型的数据有效
B. 仅支持单一特征的数据去重
C. 数据重复时默认保留第一个数据
D. 该函数不会改变原始数据排列

9、下列与标准化方法有关的说法中错误的是(A)。
A. 离差标准化简单易懂，对最大值和最小值敏感度不高
B. 常用的标准化方法，又名零一均值标准化
C. 小数定标标准化实质上就是将数据按照一定的比例缩小
D. 多个特征的数据的KMeans 聚类不需要对数据进行标准化

10、以下关于异常值检测的说法中错误的是(B)。
A. 3σ原则利用了统计学中小概率事件的原理
B. 使用箱线图方法时要求数据服从或近似服从正态分布
C. 基于聚类的方法可以进行离群点检测
D. 基于分类的方法可以进行离群点检测

11、下列关于 concat 函数、append 方法、merge 函数和 join 方法的说法正确的是(D)。
A. concat是最常用的主键合并的函数，能够实现内连接和外连接
B. append方法只能用来做纵向堆叠，适用于所有纵向堆叠情况
C. merge 是最常用的主键合并的函数，但不能够实现左连接和右连接
D. join是常用的主键合并方法之一，但不能够实现左连接和右连接

12、下列说法正确的是(C)。
A. 散点图不能在子图中绘制
B. 散点图的x轴刻度必须为数值
C. 折线图可以用作查看特征间的趋势关系
D. 箱线图可以用来查看特征间的相关关系

13、创建一个3×3的数组，下列代码中错误的是（C）
A、np.arange(0,9).reshape(3,3)
B、np.eyes(3)
C、np.random.random([3,3,3])
D、np.mat(“1,2,3;4,5,6;7,8,9”)

14、Numpy中统计数组元素个数的方法是（C）
A、ndim
B、shape
C、size
D、itemsize

15、以下关于缺失值检测的说法中，正确的是（B）
A、null和notnull可以对缺失值进行处理
B、dropna方法既可以删除观测记录，也可以删除特征
C、fillna方法中用来替换缺失值的值只能是数据框
D、pandas库中的interpolate模块包含多种插值方法

16、利用可视化绘图（C）可以发现数据的异常点。
A、密度图
B、直方图
C、盒图
D、概率图

17、Matplotlib中的（A）包提供了一批操作和绘图函数。
A、pyplot
B、Bar
C、rcparams
D、pprint

18、下列参数中调整后显示中文的是（C）
A、lines.linestyle
B、lines.linewidth
C、font.sans-serif
D、axes.unicode_minus

19、以下关于绘图标准流程说法错误的是（B）
A、绘制简单的图形可以使用缺省的画布
B、添加图例可以在绘制图形之前
C、添加X轴、Y轴的标签可以在绘制图形之前
D、修改X轴、Y轴的标签和绘制的图形没有先后

20、numpy提供了两种基本对象，一种是ndarray，一种是（B）
A、array
B、ufunc
C、matrix
D、Series

21、以下说法错误的是（C）
A、饼图一般用于表示不同分类的占比情况
B、箱线图展示了分位数的位置
C、散点图无法反映特征之间的统计关系
D、词云对于文本中出现频率较高的关键词予以视觉上的突出

二、判断题

1、两个索引不一致的series进行算数运算会出错。（×）
2、创建DataFrame时会自动加上索引，且全部列会被有序排列。（√）
3、pandas中数据的重建索引指对索引重新排序而不是修改。（√）
4、交叉表是一种特殊的透视表，主要用于计算分组频率。（√）
5、pandas中的数据对象的索引可以随时被修改。（×）
6、创建Series时如果指定了index，则只能用index访问数据。（×）
7、pandas中利用merge函数合并数据表时默认的是内连接方式。（√）
8、pandas中的描述性统计一般会包括缺失数据。（×）
9、语句dataframe.dropna(thresh=len(df)*0.9,axis=1)表示如果某列的缺失值超过90%则删除该列。（×）
10、利用merge方法合并数据时允许合并的dataframe之间没有连接键。（×）
11、哑变量（Dummy Variables)又称虚拟变量，是用以反映质的属性的一个人工变量。（√）
12、Seaborn的绘图更加便捷美观，是Matplotlib的替代。（×）
13、需要转换默认的Seaborn绘图风格，只需调用有参数设置的set方法。（×）
14、使用Seaborn中的set_style()设置主题，有5个预设的主题。（√）
15、热力图的实现过程是将离散的点信息映射为图像。（√）
16、列表是不可变对象，支持在原处修改。（×）
17、元组是不可变的，不能直接修改元组中元素的值，也不能为元组增删元素。（√）
18、python使用lambda创建匿名函数，匿名函数拥有自己的命名空间。（√）
19、同一个列表中的元素的数据类型可以各不相同。（√）
20、列表、元组和字符串属于有序序列，其中的元素有严格的先后顺序。（√）
21、集合中的元素没有特定顺序但可以重复。（×）
22、列表推导式在逻辑上等价于一个循环语句，只是形式上更加简洁。（√）
23、在python中创建一个空集合，可以直接用set1={}。（×）
24、列表、元组和字符串都支持双向索引，有效索引的范围是[-L,L],L为列表、元组或字符串的长度。（×）
25、包含列表的元组可以作为字典的键。（×）

总结

这篇文章先总结选择题和判断题，请大家关注我下一篇博客，为大家继续总结填空题、简答题和编程题。
如果这篇文章对大家有所帮助，请大家点赞＋收藏哟！您的支持是我继续创作的最大动力！

文章出处登录后可见！

已经登录？立即刷新

零基础python数据分析与可视化期末老师划重点版超详细题目配答案

文章目录

一、选择题

二、判断题

总结

相关推荐