KI6WSzSI6 个人主页

@KI6WSzSI6

KI6WSzSI6

2026-06-21 15:47:46 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

你的显卡能跑多少算子？用 55 个检查项，给 PyTorch GPU 环境做一次冒烟测试

所以"输出还在 cuda 上"这个结论的含金量，其实比"证明该算子有高性能 GPU kernel"低得多。SDPA 会走数学 fallback，仍在 GPU tensor 上运行，但对长序列、大 batch 的 LLM workload 来说性能差距明显。——这 54 个只是"输出还在 GPU 上"，不是"证明有高性能 GPU kernel"。如果你看到有人拿类似的数字说"ROCm 在 Windo

#pytorch #人工智能 #python

【GUI-Agent】阿里通义MAI-UI 代码阅读（1）--- 总体

MCP之所以能把长UI操作压缩成少量API调用，核心是用“低成本、确定性、结构化“的文本通道替换“高成本、概率性、像素级“的视觉通道 ----- 而MAI-UI刚好通过统一tool_call语法 + 文本回灌mcp_response + 工具schema一次性渲染这三件事，从而让这种压缩在工程上自然成立、不需要额外特化的代码路径。MAI-UI 并不是MCP的实现方，而是MCP的消费方一它把外部MC

#ui

【GUI-Agent】阿里通义MAI-UI 代码阅读（1）--- 总体

#ui

AI编程系列01：裸 API 账单场景下，如何自建 LLM 用量可视化看板

一个 LLM 使用量监控功能。

到底了