一、flops-CPU算力的计算
1、CPU的计算能力你了解吗?
FLOPS (Floating-point operations per second的缩写),即每秒浮点运算次数。
问题1:CPU的算力与什么有关?核心?主频?
答:除了与核心、主频外还有其他因素,详见下文;
问题2:那么相同核心\主频的E5 v4的CPU和最新Icelake的CPU算力一样吗?
答:不一样,还和CPU的指令集及FMA系数有关,详见下文;
问题3:不同代数的CPU如何计算它的算力呢?计算公式是什么?
答:我们以icelake为例,较大家如何计算。
二、CPU算力计算公式:
Flops=【CPU核数】*【单核主频】*【CPU单个周期浮点计算能力】
以6348 CPU为例,支持AVX512指令集,且FMA系数=2,所以CPU每周期算力值为:
CPU单周期双精度浮点计算能力=2(FMA数量)*2(同时加法和乘法)*512/64=32
CPU单周期单精度浮点计算能力=2(FMA数量)*2(同时加法和乘法)*512/32=64

6348 CPU
英特尔® 至强® Gold 6348 处理器,28c,2.60 GHz,42M 高速缓存, TDP 235w
6348双精算力=28x2.6(10^9)x(32)/(10^12)=2.3Tflops
6348单精算力=28x2.6(10^9)x(64)/(10^12)=4.6Tflops
通过https://ark.intel.com/content/www/cn/zh/ark.html查看CPU的FMA系数和指令集

以6348为例

支持AVX-512
三、GPU算力的计算

A100的算力
A100的核心参数:
1、CUDA核心数: 6912个
2、加速频率:1.41 GHz
3、GPU每核心单个周期浮点计算系数是2
A100的标准算力(FP32单精)
=6912x1.41x2= 19491.84 Gflots=19.5Tflops
双精算力=19.5Tflops/2=9.7Tflops
更多GPU相关的参数查询可以访问如下网址
https://www.techpowerup.com/gpu-specs/
更多视频学习资料,请访问我的B站主页!