
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
你的显卡能跑多少算子?用 55 个检查项,给 PyTorch GPU 环境做一次冒烟测试
所以"输出还在 cuda 上"这个结论的含金量,其实比"证明该算子有高性能 GPU kernel"低得多。SDPA 会走数学 fallback,仍在 GPU tensor 上运行,但对长序列、大 batch 的 LLM workload 来说性能差距明显。——这 54 个只是"输出还在 GPU 上",不是"证明有高性能 GPU kernel"。如果你看到有人拿类似的数字说"ROCm 在 Windo
【GUI-Agent】阿里通义MAI-UI 代码阅读(1)--- 总体
MCP之所以能把长UI操作压缩成少量API调用,核心是用“低成本、确定性、结构化“的文本通道替换“高成本、概率性、像素级“的视觉通道 ----- 而MAI-UI刚好通过统一tool_call语法 + 文本回灌mcp_response + 工具schema一次性渲染这三件事,从而让这种压缩在工程上自然成立、不需要额外特化的代码路径。MAI-UI 并不是MCP的实现方,而是MCP的消费方一它把外部MC
【GUI-Agent】阿里通义MAI-UI 代码阅读(1)--- 总体
MCP之所以能把长UI操作压缩成少量API调用,核心是用“低成本、确定性、结构化“的文本通道替换“高成本、概率性、像素级“的视觉通道 ----- 而MAI-UI刚好通过统一tool_call语法 + 文本回灌mcp_response + 工具schema一次性渲染这三件事,从而让这种压缩在工程上自然成立、不需要额外特化的代码路径。MAI-UI 并不是MCP的实现方,而是MCP的消费方一它把外部MC
AI编程系列01:裸 API 账单场景下,如何自建 LLM 用量可视化看板
一个 LLM 使用量监控功能。
到底了







