1.导入数据
import numpy as np
import csv
2.获取数据
iris_data=[]
with open("iris.csv") as csvfile:
csv_reader=csv.reader(csvfile) #用csv.reader读取csvfile文件
birth_header=next(csv_reader) #读取第一行各列标题
for row in csv_reader:
iris_data.append(row)
3.数据清理,去掉索引号
iris_list=[]
for row in iris_data:
iris_list.append(tuple(row[1:]))
iris_list
4.数据统计
(1)创建数据类型
datatype=np.dtype([("Sepal.Length",np.str_,40),
("Sepal.Width",np.str_,40),
("Petal.Length",np.str_,40),
("Petal.Width",np.str_,40),
("Species",np.str_,40)])
datatype
(2)创建二维数组
iris_data=np.array(iris_list,dtype=datatype)
iris_data
(3)将待处理数据的类型转化为float类型
PetalLength=iris_data["Petal.Length"].astype(float)
PetalLength
(4)排序
np.sort(PetalLength)
(5)数据去重
np.unique(PetalLength)
(6)对指定列求和、均值、标准差、方差、最小值及最大值
print("sum:",np.sum(PetalLength))
print("mean:",np.mean(PetalLength))
print("std:",np.std(PetalLength))
print("var:",np.var(PetalLength))
print("min:",np.min(PetalLength))
print("max:",np.max(PetalLength))
运行结果如下:
文章出处登录后可见!
已经登录?立即刷新