【Python】pandas中的std()函数—参数ddof的理解

青葱年少 • 2023年3月30日上午11:04 • Python • 阅读 127

在利用pandas进行数据分析时，有时需要计算某一列数据的标准差，我们常用std()函数来实现，但是一般都没有关注过里面的一个重要参数ddof，本文就来介绍一下这个参数的理解。

ddof参数的取值一般有两个，即ddof=0或者ddof=1。

目录

ddof=0时：

当我们的参数取ddof=0时，计算的是总体标准差，计算公式为：
【Python】pandas中的std()函数—参数ddof的理解
其中，，表示为数据的均值，计算公式为：

其中，为总体个数。

ddof=1时：

当ddof=1时，计算的是样本的标准差，计算公式为：
【Python】pandas中的std()函数—参数ddof的理解
字母的代表方式与上文一样，只不过这里的表示的是样本的个数。

举例说明

我们在实际应用中看不同的计算方式得到的结果：

首先展示我们的数据集：

import numpy as np
import pandas as pd
data = pd.read_excel('EXE5_1.xlsx')
data

std_ddof0 = np.std(data.iloc[:,1],ddof=0)
std_ddof0

40280.5706797213

std_ddof1 = np.std(data.iloc[:,1],ddof=1)
std_ddof1

41925.34721153412

可以明显的看出，ddof=1时，计算的数值偏大，是因为分母为【Python】pandas中的std()函数—参数ddof的理解。

文章出处登录后可见！

已经登录？立即刷新

赞 (0)

青葱年少普通用户

0

数据分析案例-对某宝用户评论做情感分析

上一篇 2023年3月30日上午11:04

【深度学习】之激活函数篇[Sigmoid、tanh、ReLU、Leaky ReLU、Mish、Hardswish、SiLU]附绘图Python代码。

下一篇 2023年4月5日上午8:03