站点图标 AI技术聚合

Python:读取iris数据集中鸢尾花的萼片,花瓣长度,并对其进行排序、去重、并求出和,累计和,均值,标准差、方差、最大值和最小值

1.导入数据
import numpy as np
import csv
2.获取数据
iris_data=[]
with open("iris.csv") as csvfile:
    csv_reader=csv.reader(csvfile)  #用csv.reader读取csvfile文件
    birth_header=next(csv_reader)   #读取第一行各列标题
    for row in csv_reader:
        iris_data.append(row)
3.数据清理,去掉索引号
iris_list=[]
for row in iris_data:
    iris_list.append(tuple(row[1:]))
iris_list
4.数据统计
(1)创建数据类型
datatype=np.dtype([("Sepal.Length",np.str_,40),
                   ("Sepal.Width",np.str_,40),
                   ("Petal.Length",np.str_,40),
                   ("Petal.Width",np.str_,40),
                   ("Species",np.str_,40)])
datatype
(2)创建二维数组
iris_data=np.array(iris_list,dtype=datatype)
iris_data
(3)将待处理数据的类型转化为float类型
PetalLength=iris_data["Petal.Length"].astype(float)
PetalLength
(4)排序
np.sort(PetalLength)
(5)数据去重
np.unique(PetalLength)
(6)对指定列求和、均值、标准差、方差、最小值及最大值
print("sum:",np.sum(PetalLength))
print("mean:",np.mean(PetalLength))
print("std:",np.std(PetalLength))
print("var:",np.var(PetalLength))
print("min:",np.min(PetalLength))
print("max:",np.max(PetalLength))

运行结果如下:

 

 

文章出处登录后可见!

已经登录?立即刷新
退出移动版