1.概述
当数据(x)按照最小值中心化后,再按极差(最大值 – 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,而这个过程,就叫做数据归一化(Normalization),又称Min-Max Scaling。
- 归一化后的数据服从正态分布。
- 公式:
2.代码实现
2.1 代码
from sklearn.preprocessing import MinMaxScaler
import pandas as pd
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
# pd.DataFrame(data)
# 实现归一化
scaler = MinMaxScaler() # 实例化
scaler.fit(data) # 在这里本质是生成min(x)和max(x)
result = scaler.transform(data) # 通过接口导出结果
# 使用MinMaxScaler的参数feature_range实现将数据归一化到[0,1]以外的范围中
scaler1 = MinMaxScaler(feature_range=[5,10])
result1 = scaler1.fit_transform(data)
result1
2.2 结果
-
归一化之前的数据:
-
归一化后(默认缩放范围为[0,1]):
-
归一化到指定范围:
文章出处登录后可见!
已经登录?立即刷新