当大模型不再吐 Markdown:从 Claude 团队的 HTML 实践看 AI 输出范式转变
摘要: 随着AI Agent能力的提升,Markdown作为默认输出格式的局限性日益凸显。Anthropic团队提出HTML更适合作为AI与人类沟通的载体,因其具备更强的表达力(支持交互式图表、UI原型等)、双向交互能力(可视化操作闭环)和易分享性。尽管HTML存在Token消耗增加、版本控制困难等代价,但其信息传递效率显著优于Markdown。国内开发者可在技术评审、代码Review等场景尝试H
引言
2026 年 5 月,Anthropic Claude Code 团队成员 Thariq Shihipar 发表了一篇题为《Using Claude Code: The Unreasonable Effectiveness of HTML》的技术博客,提出了一个看似简单却意义深远的观点:在 AI Agent 时代,Markdown 正在成为一种限制性格式,HTML 才是大模型与人类沟通的更优载体。
这篇文章在海外开发者社区引发了广泛讨论。本文将系统梳理其核心论点,分析这一趋势背后的逻辑,并探讨对国内 AI 应用开发者的启示。
一、Markdown 的困境:为什么"够用"不再够用
Markdown 之所以成为 AI 输出的默认格式,有其历史合理性:语法简洁、易于编辑、跨平台兼容。然而,随着大模型能力的快速提升,这些优势正在被新的需求所稀释。
Thariq 在文中指出了几个关键痛点:
1. 信息密度不足
当 Agent 需要表达复杂信息时——数据流图、多方案对比、交互式原型——Markdown 的表达力捉襟见肘。开发者不得不依赖 ASCII 图表或 Unicode 字符来"模拟"可视化效果,这本质上是一种信息传递的退化。
2. 阅读意愿的断崖式下降
Thariq 坦言,他已经无法认真阅读超过 100 行的 Markdown 文件,更不用说让团队其他成员去阅读。这意味着大模型精心组织的长文本输出,很可能从未被人类完整消费过。
3. 编辑场景的根本变化
在 Agent 工作流中,人类越来越少直接编辑这些文件。它们更多地作为规格说明、参考文档或头脑风暴的产物存在。当"易于手动编辑"不再是核心需求时,Markdown 最大的优势便失去了根基。
二、HTML 作为 AI 输出格式的优势分析
Thariq 提出的替代方案是让大模型直接输出完整的 HTML 文件。这一选择的优势体现在多个维度:
2.1 表达力的质变
HTML + CSS + JavaScript 的组合几乎可以表达任何形式的信息:
| 信息类型 | Markdown 方案 | HTML 方案 |
|---|---|---|
| 数据对比 | 纯文本表格 | 可排序、可筛选的交互式表格 |
| 流程图 | ASCII 字符拼接 | SVG 矢量图,支持缩放和交互 |
| 设计方案 | 文字描述 | 实际渲染的 UI 原型 |
| 参数调优 | 列举选项 | 滑块、旋钮等实时调节控件 |
| 代码审查 | 代码块 + 注释 | 带语法高亮、行内标注、严重度色标的 diff 视图 |
2.2 双向交互能力
这是 HTML 相对于 Markdown 最具颠覆性的优势。Thariq 描述了一种工作模式:Agent 生成包含交互控件的 HTML 页面,用户通过操作这些控件(拖拽排序、调节参数、勾选选项)来表达意图,然后通过"复制为 Prompt"按钮将结果回传给 Agent。
这实质上构建了一个可视化的人机交互闭环,远比纯文本对话高效。
2.3 可分享性
Markdown 文件的分享依赖特定渲染器(GitHub、Typora 等),而 HTML 文件只需一个浏览器即可完整呈现。上传至任意静态托管服务后,一个链接即可分享给所有相关方。
2.4 具体应用场景
根据 Thariq 的实践,HTML 输出在以下场景中表现尤为突出:
- 规格说明与方案探索:生成多方案对比页面,包含 mockup、数据流图和代码片段
- 代码审查:为 PR 生成可视化的变更说明,附带架构图和逐行标注
- 研究报告:综合多数据源生成可交互的研究文档,支持幻灯片模式
- 一次性编辑器:为特定任务生成专用的可视化编辑界面(如工单排序、配置编辑、Prompt 调优)
三、代价与权衡
任何技术选择都有其代价,HTML 输出模式也不例外:
Token 消耗增加:HTML 的冗余语法(标签、属性、CSS)导致同等信息量下 token 用量显著上升。Thariq 估计生成时间约为 Markdown 的 2-4 倍。
版本控制困难:HTML 的 diff 噪声大、可读性差,这对需要 Git 管理的团队协作场景构成挑战。
生成延迟:更长的输出意味着更长的等待时间,在需要快速迭代的场景中可能影响体验。
然而,Thariq 的核心论点是:如果输出没有被人类有效消费,那么再高效的生成也是浪费。 HTML 虽然成本更高,但信息传递的有效性远超 Markdown,综合 ROI 反而更优。
四、对国内开发者的启示
4.1 立即可实践的建议
国内开发者可以在以下场景中尝试 HTML 输出模式:
- 技术方案评审:让 Agent 生成可交互的方案对比页面,替代冗长的文档
- 代码 Review:为复杂 PR 生成可视化说明,降低 reviewer 的认知负担
- 周报/汇报:生成带图表和交互的 HTML 报告,替代 PPT 或 Word
实践方式很简单——在 Prompt 中指定"输出为 HTML 文件"即可,无需复杂的配置或工具链。
4.2 产品设计层面的思考
对于正在构建 AI Native 应用的团队,这一趋势意味着:
- Agent 的输出层需要重新设计:不再是简单的文本流,而是可能包含完整 HTML 页面的富媒体输出
- 前端架构需要适配:需要安全的沙箱环境来渲染 Agent 生成的 HTML
- 交互设计需要新范式:从"用户输入文本 → Agent 输出文本"转变为"Agent 生成界面 → 用户操作界面 → 结果回传 Agent"
4.3 值得关注的后续发展
- Anthropic 是否会在 Claude API 层面提供 HTML 输出的原生支持
- 主流 IDE 和开发工具是否会内置 HTML 预览能力
- AG-UI 等 Agent UI 协议如何适配这一趋势(后续文章将专门讨论)
五、结语
从 Markdown 到 HTML 的转变,表面上是输出格式的选择,本质上反映的是 AI Agent 与人类协作模式的深层演进。当 Agent 的能力足够强大,人类的角色从"编辑者"转变为"审阅者"和"决策者"时,输出格式的设计目标也应从"易于编辑"转向"易于理解和交互"。
这不是一个非此即彼的选择。在需要快速迭代、版本控制严格的场景中,Markdown 仍有其不可替代的价值。但对于需要深度理解、多方协作、可视化表达的场景,HTML 正在展现出压倒性的优势。
对于 AI 应用开发者而言,现在是时候重新审视"大模型输出应该长什么样"这个基础问题了。
参考资料:
- Thariq Shihipar, “Using Claude Code: The Unreasonable Effectiveness of HTML”, 2026
- 示例集合:https://thariqs.github.io/html-effectiveness
更多推荐




所有评论(0)