【Python】pandas中的std()函数—参数ddof的理解

在利用pandas进行数据分析时,有时需要计算某一列数据的标准差,我们常用std()函数来实现,但是一般都没有关注过里面的一个重要参数ddof,本文就来介绍一下这个参数的理解。

ddof参数的取值一般有两个,即ddof=0或者ddof=1

ddof=0时:

当我们的参数取ddof=0时,计算的是总体标准差,计算公式为:
【Python】pandas中的std()函数—参数ddof的理解
其中,【Python】pandas中的std()函数—参数ddof的理解【Python】pandas中的std()函数—参数ddof的理解表示为数据【Python】pandas中的std()函数—参数ddof的理解的均值,计算公式为:
【Python】pandas中的std()函数—参数ddof的理解
其中,【Python】pandas中的std()函数—参数ddof的理解为总体个数。

ddof=1时:

当ddof=1时,计算的是样本的标准差,计算公式为:
【Python】pandas中的std()函数—参数ddof的理解
字母的代表方式与上文一样,只不过这里的【Python】pandas中的std()函数—参数ddof的理解表示的是样本的个数。

举例说明

我们在实际应用中看不同的计算方式得到的结果:

首先展示我们的数据集:

import numpy as np
import pandas as pd
data = pd.read_excel('EXE5_1.xlsx')
data

【Python】pandas中的std()函数—参数ddof的理解

std_ddof0 = np.std(data.iloc[:,1],ddof=0)
std_ddof0
40280.5706797213
std_ddof1 = np.std(data.iloc[:,1],ddof=1)
std_ddof1
41925.34721153412

可以明显的看出,ddof=1时,计算的数值偏大,是因为分母为【Python】pandas中的std()函数—参数ddof的理解

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年3月30日 上午11:04
下一篇 2023年4月5日 上午8:03

相关推荐