Ryzen AI Max+ 395和 RTX 5070 Ti算力对比

zhangfeng1133

323人浏览 · 2026-05-27 08:27:58

zhangfeng1133 · 2026-05-27 08:27:58 发布

Ryzen AI Max+ 395和 RTX 5070 Ti算力对比

一、Ryzen AI Max+ 395（你前面问的）

AMD 官网白纸黑字（2026‑05‑27 查询）：

NPU：50 INT8 TOPS（不是 TFLOPS，是 INT8）
整机（CPU+GPU+NPU）：126 INT8 TOPS
官方从未给出任何 FP8 TFLOPS 数值

我之前“估 FP8 ≈ 50 TFLOPS”是错误脑补，正式收回：

✅ Ryzen AI Max+ 395：无官方 FP8 TFLOPS 数据
✅ NPU 只有 50 INT8 TOPS，不是 50 TFLOPS
✅ 它是移动端 APU，不是 400 TFLOPS 级别的怪物

二、RTX 5070 Ti（你说“昨天看到 400 TFLOPS”）

查 NVIDIA 官网 + 媒体实测（2026‑05‑27）：

FP32：44 TFLOPS
FP16：88 TFLOPS
FP8（Tensor Core 峰值）：351.5 TFLOPS
FP4（稀疏）：≈1400 TFLOPS

你看到的**“400 TFLOPS”**，实际是：

RTX 5070 Ti 的 FP8 稀疏峰值 ≈ 350–400 TFLOPS（宣传值）

重点：

5070 Ti 是桌面独显，300W
395 是移动 APU，55–120W
两者完全不是一个量级：
- 5070 Ti FP8 ≈ 350 TFLOPS
- 395 NPU INT8 = 50 TOPS = 0.05 TFLOPS

三、为什么差这么多？

TOPS vs TFLOPS：
- 1 TOPS = 10¹² 次 8位运算/秒
- 1 TFLOPS = 10¹² 次 32位浮点运算/秒
- INT8 TOPS 不能直接等于 FP8 TFLOPS
395 的定位：端侧 AI（笔记本/迷你主机）
- 强项：本地跑 7B–70B 大模型、低功耗、大内存（128GB）
- 弱项：算力远不如桌面高端独显
5070 Ti 的定位：桌面游戏+AI 显卡
- 强项：Tensor Core 专门怼 FP8/FP4，算力爆炸
- 弱项：功耗高、体积大、不能做笔记本

四、结论（别再被营销文带偏）

Ryzen AI Max+ 395
- NPU：50 INT8 TOPS（=0.05 INT8 TFLOPS）
- 无官方 FP8 数据，远不到 50 TFLOPS，更不可能 400
RTX 5070 Ti
- FP8 峰值：≈350 TFLOPS（宣传≈400）
- 确实是 400 级，但和 395 没关系
一句话总结
- 395 是端侧 AI 小钢炮（低功耗、能跑大模型）
- 5070 Ti 是桌面 AI 核弹（高功耗、算力碾压）

资料来源 doubao

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

cover

调查研究-202 SGLang 深度解析：为什么大模型推理框架不只是“把模型跑起来“

AMD开发者中国社区

cover

Qwen2.5-Coder-32B-Instruct-AWQ模型部署

AMD开发者中国社区

AI-Gateway-LLM网关与多模型路由

企业——在之上，专述等多实现的路由、限流、、缓存与可观测契约；并与对齐。：vLLM/KV/量化见；Agent 应用组件见；Guardrails 见。

AMD开发者中国社区

所有评论(0)

查看更多评论

zhangfeng1133

已为社区贡献14条内容