NumPy图解操作详解

一、简介

NumPy是Python中诸多数据科学库的重要基础,例如,pandas,OpenCV,TensorFlow等,学习NumPy对其它NumPy依赖数据科学库意义重大

 

0、NumPy数组 vs Python列表

  • Numpy数组中插入、移除元素没Python列表高效;

  • Numpy数组可直接做四则运算、Python列表则需借助列表推倒式等;

  • Numpy数组更紧凑,高维时尤为明显;

  • Numpy数组向量化后运算速度比Python列表更快;

  • Numpy数组通常是同质化的,仅仅当数组中元素类型一致时处理速度快。

1、一维数组 (向量)

1.1 数组创建

  • 通过Python列表创建

    ⚠️必须确保列表中元素类型一致,否则,进一步处理报错。⚠️NumPy数组区别于Python列表,不能在数组末尾直接扩展元素。

  • 通过np.zeros或np.empty等创建 可以通过np.zeros、np.ones、np.empty、np.full等创建数组。

  • 通过np.zeros_like或np.empty_like等创建 以上都有对应的_like函数,可快速创建a数组长度一致数组, 

  • 通过np.arange和np.linspace创建 np.arange类似于Python range

    ⚠️np.arange对元素数据类型敏感,特别是float类别,以下方式可供参考

  • 创建随机数组 已弃用方法,

    新方法, 

1.2 数组索引

1.1中介绍了多种构建数组的方法,1.2中介绍如何愉快的从数组中取元素。

  • 常见索引方法

  • 布尔运算符索引 

    ⚠️不能用三元运算符,如3<=a<=5。

  • np.where、np.clip+布尔运算符索引

1.3 数组操作

计算速度是NumPy的亮点之一,其数组运算操作速度接近C++,把数组当作整体来运算,避免Python的循环,可以解决一部分Python慢的问题,这一节介绍NumPy的数组操作。

  • 加减乘除、取整等基础操作 类似python加减乘除、取余数,

    向上、向下、四舍五入最大、最小、均值等,

  • 三角函数

  • 标量计算

  • 支持更多数学方法

  • 排序 只有部分Python列表排序操作,

1.4 数组元素查找

无Python list的index函数,通常有三种方法,

  • where,但不够pythonic、需压遍历数组;

  • next,较快,需要Numba;

  • searchsorted,适合已排序数组。

1.5 浮点数比较

2 二维数组 (矩阵)

2.1 二维数组创建

同一维数组,⚠️使用[[]],

随机数组构建

2.2 二维数组索引

比Python嵌套列表更方便

2.3 二维数组操作

NumPy支持跨行、跨列操作,此时NumPy引入了axis的概念,axis=1,axis=0👇,

  • 行列or行or列求和 

  • +、-、*、/、//、**和@  +、-、*、/、//、**类似一维数组,@为二维数组独有,二维数组整体计算,

    二维数组与单个元素、一维数组计算,@计算非对称线性代数外积,

  • 行/列向量计算

  • 二维数组变形 

    一维数组、二维数组之间互转,

  • hstack、vstack、column_stack拼接数组

  • hsplit、vsplit拆分二维数组

  • tile、repeat复制数组

  • delete二维数组删除 

  • insert二维数组插入 

  • append二维数组末尾操作

  • pad二维数组边界操作

2.4 二维数组网格化

针对网格化,C、传统Python及MATLAB都有解决办法,

NumPy的广播机制让网格化更高效,此外,网格还可以用于数组索引,

2.5 二维数组统计

支持min/max, argmin/argmax, mean/median/percentile, std/var等函数,前面2.3节介绍过部分。

argmin/argmax返回最大、最小值下标,all和any适用特定维度, 

2.6 二维数组排序

注意指定axis,

  • argsort按某一列排序

  • lexsort对所有列进行排序 ⚠️总是按行执行,从下到上,

  • sort结合order

多维数组 (3维及更高维数组)

下面主要以3维数组为例。

3.1 多维数组创建

通过reshape 1维数组、嵌套Python list创建多维数组,索引(z,y,x)中,z是平面方向,(y,x)在z平面上坐标,

3.2 多维数组创建hstack,vstack

适用3维数组,多了一个dstack,

⚠️但是,这些函数支持的索引顺序是(y,x,z),

需要借助concatenate改变多维数组布局,广播机制也适用多维数组,einsum(Einstein summation)函数在多维数组中可避免过多Python循环,让代码更简洁。

 

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2022年5月18日
下一篇 2022年5月18日

相关推荐