RTX40 系列游戏本与台式机显卡 AI 计算力对比

        RTX40 系列游戏本还有几天就上市了,商家选了个比较特别的日子,2 月 22 号 22:00,真是有心了。为了用游戏本做 AI 的朋友选的时候有的放矢,特意查了一下 RTX40 系列的 CUDA 核心与频率,计算一下 FP32 TFLOPS,便于比较。

笔记本 GPU:

RTX40 系列笔记本 GPU:

RTX30 系列笔记本 GPU:

       RTX30 系列的游戏本还占有较大的市场,估计随着 RTX40 系列游戏本的推出,价格上可能会有一些优惠,性价比会有提高,也可以关注一下。

RTX40 系列与 RTX30 系列游戏本对比:

NVIDIA 给出的测试显示,RTX40 系列笔记本 GPU 性能比上一代有较大的提高:

除了加速频率的提升,还得益于构架的升级:

RTX40 系列与RTX30 系列游戏本计算力对比:

 台式机显卡:

 RTX40 系列台式机 GPU:

 RTX30 系列台式机 GPU:

 RTX40 系列与 RTX30 系列台式机显卡对比:

 小结:

        比较 RTX30 与 RTX40 系列的游戏本 GPU,不难发现,稍低端的 RTX4060 与 RTX3060 的 TFLOPS 差别不大,而且 RTX4060 的位宽比 RTX3060 低,估计老黄的刀法是冲着 10~20 TFLOPS 去的,差不多够用就得了,再高了,散热和性价比就不好控制了;高端的 RTX4090 游戏本的 FP32 达到了接近 40 TFLOPS;目前来看,不能再高了,再高估计散热就 Hold 不住了。

        RTX4090 台式机显卡的 FP32 达到了 82.6 TFLOPS,RTX4070Ti 也到了 40.1 TFLOPS,超过了上一代的旗舰 RTX3090Ti,性能再低的就看看游戏本得了。      

        目前比较火的 ChatGPT,底层拥有一个 1750 亿参数的预训练大模型,支撑其算力基础设施至少需要上万颗英伟达 GPU A100( 19.5 TFLOPS),一次模型训练成本超过 1200 万美元;训练阶段总算力消耗约为 3640PF-days(即1 PetaFLOP/s效率跑3640天),如果采用 121 块最新的 RTX4090 台式机显卡,不停的跑,得跑一整年!

                                                                                                老徐,2023/2/17

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
xiaoxingxing的头像xiaoxingxing管理团队
上一篇 2023年6月16日
下一篇 2023年6月16日

相关推荐