RTX40 系列游戏本与台式机显卡 AI 计算力对比

RTX40 系列游戏本还有几天就上市了，商家选了个比较特别的日子，2 月 22 号 22:00，真是有心了。为了用游戏本做 AI 的朋友选的时候有的放矢，特意查了一下 RTX40 系列的 CUDA 核心与频率，计算一下 FP32 TFLOPS，便于比较。

笔记本 GPU：

RTX40 系列笔记本 GPU：

RTX30 系列笔记本 GPU：

RTX30 系列的游戏本还占有较大的市场，估计随着 RTX40 系列游戏本的推出，价格上可能会有一些优惠，性价比会有提高，也可以关注一下。

RTX40 系列与 RTX30 系列游戏本对比：

NVIDIA 给出的测试显示，RTX40 系列笔记本 GPU 性能比上一代有较大的提高：

除了加速频率的提升，还得益于构架的升级：

RTX40 系列与RTX30 系列游戏本计算力对比：

台式机显卡：

RTX40 系列台式机 GPU：

RTX30 系列台式机 GPU：

RTX40 系列与 RTX30 系列台式机显卡对比：

小结：

比较 RTX30 与 RTX40 系列的游戏本 GPU，不难发现，稍低端的 RTX4060 与 RTX3060 的 TFLOPS 差别不大，而且 RTX4060 的位宽比 RTX3060 低，估计老黄的刀法是冲着 10~20 TFLOPS 去的，差不多够用就得了，再高了，散热和性价比就不好控制了；高端的 RTX4090 游戏本的 FP32 达到了接近 40 TFLOPS；目前来看，不能再高了，再高估计散热就 Hold 不住了。

RTX4090 台式机显卡的 FP32 达到了 82.6 TFLOPS，RTX4070Ti 也到了 40.1 TFLOPS，超过了上一代的旗舰 RTX3090Ti，性能再低的就看看游戏本得了。

目前比较火的 ChatGPT，底层拥有一个 1750 亿参数的预训练大模型，支撑其算力基础设施至少需要上万颗英伟达 GPU A100( 19.5 TFLOPS)，一次模型训练成本超过 1200 万美元；训练阶段总算力消耗约为 3640PF-days（即1 PetaFLOP/s效率跑3640天），如果采用 121 块最新的 RTX4090 台式机显卡，不停的跑，得跑一整年！

老徐，2023/2/17

文章出处登录后可见！

已经登录？立即刷新