CPU的计算机能力和AVX512指令集

1、Intel的独门绝技

AVX-512指令集包含非常多可以加速工作负载的指令,包括科学模拟、金融分析、人工智能、深度学习、3D建模、音视频处理器、加密解密、数据压缩等。

按照Intel的说法,如果软件支持AVX-512指令集,那么Intel的处理器会有极大的性能提升。

2、对于普通用户意义不大,对于科研很重要

AVX-512指令集很长一段时间被人们诟病,比喻成鸡肋,主要有两方面原因,1、支持AVX-512指令集的软件的确不多;2、AVX-512 会极大提升处理器的功耗和发热,对用户的散热系统提出了很高的要求 。

但对于做科研的科学家们,特比是人工智能、深度学习方面的研究提升了效率。

3、AMD第四代霄龙加入AVX-512,这种指令集之前是Intel独占。

4、CPU算力的计算方法:

FLOPS,即每秒浮点运算次数, 是每秒所执行的浮点运算次数(Floating-point operations per second;缩写:FLOPS)的简称,被用来评估电脑效能.

5、CPU算力计算公式

FLOAS=核数*单核主频*CPU单个周期浮点计算值

6、常见的浮点计算值的单位:

一个MFLOPS(megaFLOPS)等於每秒一佰万(=10^6)次的浮点运算,

一个GFLOPS(gigaFLOPS)等於每秒拾亿(=10^9)次的浮点运算,

一个TFLOPS(teraFLOPS)等於每秒万亿(=10^12)次的浮点运算,

一个PFLOPS(petaFLOPS)等於每秒千万亿(=10^15)次的浮点运算,

一个EFLOPS(exaFLOPS)等於每秒百亿亿(=10^18)次的浮点运算

一个ZFLOPS(zettaFLOPS)等于每秒十万京(=10^21)次的浮点运算。

7、浮点数有不同的规格

FP16(半精度)占用2个字节,共16bit、FP32( 单精度)占用4个字节,共32bit,、FP64(F双精度)占用8个字节,共64bit,

支持AVX2的处理器在1个核心1个时钟周期可以执行16次浮点运算,也称为16FLOPs

CPU的算力=核心的个数 x 核心的频率 x 16FLOPs

支持AVX512的处理器在1个核心1个时钟周期可以执行32次浮点运算,也称为32FLOPs

CPU的算力=核心的个数 x 核心的频率 x 32FLOPs

8、CPU的单双精度计算机能力

常用双精度浮点运算能力衡量CPU的科学计算的能力,就是处理64bit小数点浮动数据的能力

支持AVX512指令集,且FMA系数=2,所以CPU每周期算力值为:

CPU单周期双精度浮点计算能力=2(FMA数量)*2(同时加法和乘法)*512/64=32

CPU单周期单精度浮点计算能力=2(FMA数量)*2(同时加法和乘法)*512/32=64

具体如下:

Intel Xeon Gold 6348 ,28c,2.60 GHz,42MB,235w

6348双精算力=40×2.3(10^9)x(32)/(10^12)=2.3Tflops

6348单精算力=40×2.3(10^9)x(64)/(10^12)=4.6Tflops

未加入AVX512指令集,计算能力减半。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
青葱年少的头像青葱年少普通用户
上一篇 2023年9月19日
下一篇 2023年9月19日

相关推荐