Ryzen AI Max+ 395和 RTX 5070 Ti算力对比
主流大模型推理框架开源协议汇总 核心推理引擎中,llama.cpp(MIT)和ONNX Runtime(MIT)协议最宽松,vLLM、TGI等采用Apache 2.0也可商用。本地工具如Ollama(MIT)适合快速部署,但KoboldCpp(AGPL-3.0)具有开源传染性。服务框架多采用Apache 2.0(如BentoML)。协议宽松度对比显示:MIT/BSD最自由,Apache 2.0含专
·
Ryzen AI Max+ 395和 RTX 5070 Ti算力对比
一、Ryzen AI Max+ 395(你前面问的)
AMD 官网白纸黑字(2026‑05‑27 查询):
- NPU:50 INT8 TOPS(不是 TFLOPS,是 INT8)
- 整机(CPU+GPU+NPU):126 INT8 TOPS
- 官方从未给出任何 FP8 TFLOPS 数值
我之前“估 FP8 ≈ 50 TFLOPS”是错误脑补,正式收回:
- ✅ Ryzen AI Max+ 395:无官方 FP8 TFLOPS 数据
- ✅ NPU 只有 50 INT8 TOPS,不是 50 TFLOPS
- ✅ 它是移动端 APU,不是 400 TFLOPS 级别的怪物
二、RTX 5070 Ti(你说“昨天看到 400 TFLOPS”)
查 NVIDIA 官网 + 媒体实测(2026‑05‑27):
- FP32:44 TFLOPS
- FP16:88 TFLOPS
- FP8(Tensor Core 峰值):351.5 TFLOPS
- FP4(稀疏):≈1400 TFLOPS
你看到的**“400 TFLOPS”**,实际是:
RTX 5070 Ti 的 FP8 稀疏峰值 ≈ 350–400 TFLOPS(宣传值)
重点:
- 5070 Ti 是桌面独显,300W
- 395 是移动 APU,55–120W
- 两者完全不是一个量级:
- 5070 Ti FP8 ≈ 350 TFLOPS
- 395 NPU INT8 = 50 TOPS = 0.05 TFLOPS
三、为什么差这么多?
-
TOPS vs TFLOPS:
- 1 TOPS = 10¹² 次 8位运算/秒
- 1 TFLOPS = 10¹² 次 32位浮点运算/秒
- INT8 TOPS 不能直接等于 FP8 TFLOPS
-
395 的定位:端侧 AI(笔记本/迷你主机)
- 强项:本地跑 7B–70B 大模型、低功耗、大内存(128GB)
- 弱项:算力远不如桌面高端独显
-
5070 Ti 的定位:桌面游戏+AI 显卡
- 强项:Tensor Core 专门怼 FP8/FP4,算力爆炸
- 弱项:功耗高、体积大、不能做笔记本
四、结论(别再被营销文带偏)
-
Ryzen AI Max+ 395
- NPU:50 INT8 TOPS(=0.05 INT8 TFLOPS)
- 无官方 FP8 数据,远不到 50 TFLOPS,更不可能 400
-
RTX 5070 Ti
- FP8 峰值:≈350 TFLOPS(宣传≈400)
- 确实是 400 级,但和 395 没关系
-
一句话总结
- 395 是端侧 AI 小钢炮(低功耗、能跑大模型)
- 5070 Ti 是桌面 AI 核弹(高功耗、算力碾压)
资料来源 doubao
更多推荐



所有评论(0)