CPU的计算机能力和AVX512指令集

1、Intel的独门绝技

AVX-512指令集包含非常多可以加速工作负载的指令，包括科学模拟、金融分析、人工智能、深度学习、3D建模、音视频处理器、加密解密、数据压缩等。

按照Intel的说法，如果软件支持AVX-512指令集，那么Intel的处理器会有极大的性能提升。

2、对于普通用户意义不大，对于科研很重要

AVX-512指令集很长一段时间被人们诟病，比喻成鸡肋，主要有两方面原因，1、支持AVX-512指令集的软件的确不多；2、AVX-512 会极大提升处理器的功耗和发热，对用户的散热系统提出了很高的要求。

但对于做科研的科学家们，特比是人工智能、深度学习方面的研究提升了效率。

3、AMD第四代霄龙加入AVX-512，这种指令集之前是Intel独占。

4、CPU算力的计算方法：

FLOPS，即每秒浮点运算次数, 是每秒所执行的浮点运算次数（Floating-point operations per second；缩写：FLOPS）的简称，被用来评估电脑效能.

5、CPU算力计算公式

FLOAS=核数*单核主频*CPU单个周期浮点计算值

6、常见的浮点计算值的单位：

一个MFLOPS（megaFLOPS）等於每秒一佰万（=10^6）次的浮点运算，

一个GFLOPS（gigaFLOPS）等於每秒拾亿（=10^9）次的浮点运算，

一个TFLOPS（teraFLOPS）等於每秒万亿（=10^12）次的浮点运算，

一个PFLOPS（petaFLOPS）等於每秒千万亿（=10^15）次的浮点运算，

一个EFLOPS（exaFLOPS）等於每秒百亿亿（=10^18）次的浮点运算

一个ZFLOPS（zettaFLOPS）等于每秒十万京（=10^21）次的浮点运算。

7、浮点数有不同的规格

FP16（半精度）占用2个字节，共16bit、FP32（单精度）占用4个字节，共32bit，、FP64（F双精度）占用8个字节，共64bit，

支持AVX2的处理器在1个核心1个时钟周期可以执行16次浮点运算，也称为16FLOPs

CPU的算力=核心的个数 x 核心的频率 x 16FLOPs

支持AVX512的处理器在1个核心1个时钟周期可以执行32次浮点运算，也称为32FLOPs

CPU的算力=核心的个数 x 核心的频率 x 32FLOPs

8、CPU的单双精度计算机能力

常用双精度浮点运算能力衡量CPU的科学计算的能力，就是处理64bit小数点浮动数据的能力

支持AVX512指令集，且FMA系数=2，所以CPU每周期算力值为：

CPU单周期双精度浮点计算能力=2（FMA数量）*2(同时加法和乘法)*512/64=32

CPU单周期单精度浮点计算能力=2（FMA数量）*2(同时加法和乘法)*512/32=64

具体如下：

Intel Xeon Gold 6348 ，28c，2.60 GHz，42MB，235w

6348双精算力=40×2.3（10^9）x（32）/（10^12）=2.3Tflops

6348单精算力=40×2.3（10^9）x（64）/（10^12）=4.6Tflops

未加入AVX512指令集，计算能力减半。

文章出处登录后可见！

已经登录？立即刷新