当大模型不再吐 Markdown：从 Claude 团队的 HTML 实践看 AI 输出范式转变

摘要：随着AI Agent能力的提升，Markdown作为默认输出格式的局限性日益凸显。Anthropic团队提出HTML更适合作为AI与人类沟通的载体，因其具备更强的表达力（支持交互式图表、UI原型等）、双向交互能力（可视化操作闭环）和易分享性。尽管HTML存在Token消耗增加、版本控制困难等代价，但其信息传递效率显著优于Markdown。国内开发者可在技术评审、代码Review等场景尝试H

qhvssonic

219人浏览 · 2026-05-13 17:53:52

qhvssonic · 2026-05-13 17:53:52 发布

引言

2026 年 5 月，Anthropic Claude Code 团队成员 Thariq Shihipar 发表了一篇题为《Using Claude Code: The Unreasonable Effectiveness of HTML》的技术博客，提出了一个看似简单却意义深远的观点：在 AI Agent 时代，Markdown 正在成为一种限制性格式，HTML 才是大模型与人类沟通的更优载体。

这篇文章在海外开发者社区引发了广泛讨论。本文将系统梳理其核心论点，分析这一趋势背后的逻辑，并探讨对国内 AI 应用开发者的启示。

一、Markdown 的困境：为什么"够用"不再够用

Markdown 之所以成为 AI 输出的默认格式，有其历史合理性：语法简洁、易于编辑、跨平台兼容。然而，随着大模型能力的快速提升，这些优势正在被新的需求所稀释。

Thariq 在文中指出了几个关键痛点：

1. 信息密度不足

当 Agent 需要表达复杂信息时——数据流图、多方案对比、交互式原型——Markdown 的表达力捉襟见肘。开发者不得不依赖 ASCII 图表或 Unicode 字符来"模拟"可视化效果，这本质上是一种信息传递的退化。

2. 阅读意愿的断崖式下降

Thariq 坦言，他已经无法认真阅读超过 100 行的 Markdown 文件，更不用说让团队其他成员去阅读。这意味着大模型精心组织的长文本输出，很可能从未被人类完整消费过。

3. 编辑场景的根本变化

在 Agent 工作流中，人类越来越少直接编辑这些文件。它们更多地作为规格说明、参考文档或头脑风暴的产物存在。当"易于手动编辑"不再是核心需求时，Markdown 最大的优势便失去了根基。

二、HTML 作为 AI 输出格式的优势分析

Thariq 提出的替代方案是让大模型直接输出完整的 HTML 文件。这一选择的优势体现在多个维度：

2.1 表达力的质变

HTML + CSS + JavaScript 的组合几乎可以表达任何形式的信息：

信息类型	Markdown 方案	HTML 方案
数据对比	纯文本表格	可排序、可筛选的交互式表格
流程图	ASCII 字符拼接	SVG 矢量图，支持缩放和交互
设计方案	文字描述	实际渲染的 UI 原型
参数调优	列举选项	滑块、旋钮等实时调节控件
代码审查	代码块 + 注释	带语法高亮、行内标注、严重度色标的 diff 视图

2.2 双向交互能力

这是 HTML 相对于 Markdown 最具颠覆性的优势。Thariq 描述了一种工作模式：Agent 生成包含交互控件的 HTML 页面，用户通过操作这些控件（拖拽排序、调节参数、勾选选项）来表达意图，然后通过"复制为 Prompt"按钮将结果回传给 Agent。

这实质上构建了一个可视化的人机交互闭环，远比纯文本对话高效。

2.3 可分享性

Markdown 文件的分享依赖特定渲染器（GitHub、Typora 等），而 HTML 文件只需一个浏览器即可完整呈现。上传至任意静态托管服务后，一个链接即可分享给所有相关方。

2.4 具体应用场景

根据 Thariq 的实践，HTML 输出在以下场景中表现尤为突出：

规格说明与方案探索：生成多方案对比页面，包含 mockup、数据流图和代码片段
代码审查：为 PR 生成可视化的变更说明，附带架构图和逐行标注
研究报告：综合多数据源生成可交互的研究文档，支持幻灯片模式
一次性编辑器：为特定任务生成专用的可视化编辑界面（如工单排序、配置编辑、Prompt 调优）

三、代价与权衡

任何技术选择都有其代价，HTML 输出模式也不例外：

Token 消耗增加：HTML 的冗余语法（标签、属性、CSS）导致同等信息量下 token 用量显著上升。Thariq 估计生成时间约为 Markdown 的 2-4 倍。

版本控制困难：HTML 的 diff 噪声大、可读性差，这对需要 Git 管理的团队协作场景构成挑战。

生成延迟：更长的输出意味着更长的等待时间，在需要快速迭代的场景中可能影响体验。

然而，Thariq 的核心论点是：如果输出没有被人类有效消费，那么再高效的生成也是浪费。 HTML 虽然成本更高，但信息传递的有效性远超 Markdown，综合 ROI 反而更优。

四、对国内开发者的启示

4.1 立即可实践的建议

国内开发者可以在以下场景中尝试 HTML 输出模式：

技术方案评审：让 Agent 生成可交互的方案对比页面，替代冗长的文档
代码 Review：为复杂 PR 生成可视化说明，降低 reviewer 的认知负担
周报/汇报：生成带图表和交互的 HTML 报告，替代 PPT 或 Word

实践方式很简单——在 Prompt 中指定"输出为 HTML 文件"即可，无需复杂的配置或工具链。

4.2 产品设计层面的思考

对于正在构建 AI Native 应用的团队，这一趋势意味着：

Agent 的输出层需要重新设计：不再是简单的文本流，而是可能包含完整 HTML 页面的富媒体输出
前端架构需要适配：需要安全的沙箱环境来渲染 Agent 生成的 HTML
交互设计需要新范式：从"用户输入文本 → Agent 输出文本"转变为"Agent 生成界面 → 用户操作界面 → 结果回传 Agent"

4.3 值得关注的后续发展

Anthropic 是否会在 Claude API 层面提供 HTML 输出的原生支持
主流 IDE 和开发工具是否会内置 HTML 预览能力
AG-UI 等 Agent UI 协议如何适配这一趋势（后续文章将专门讨论）

五、结语

从 Markdown 到 HTML 的转变，表面上是输出格式的选择，本质上反映的是 AI Agent 与人类协作模式的深层演进。当 Agent 的能力足够强大，人类的角色从"编辑者"转变为"审阅者"和"决策者"时，输出格式的设计目标也应从"易于编辑"转向"易于理解和交互"。

这不是一个非此即彼的选择。在需要快速迭代、版本控制严格的场景中，Markdown 仍有其不可替代的价值。但对于需要深度理解、多方协作、可视化表达的场景，HTML 正在展现出压倒性的优势。

对于 AI 应用开发者而言，现在是时候重新审视"大模型输出应该长什么样"这个基础问题了。

参考资料：

Thariq Shihipar, “Using Claude Code: The Unreasonable Effectiveness of HTML”, 2026
示例集合：https://thariqs.github.io/html-effectiveness

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

OpenClaw和Hermes的记忆有什么区别

龙虾开发者社区

2026年前端开发工程师转型AI Agent开发工程师全指南

龙虾开发者社区

如何用一套标准化框架撑起变更风险评估？agent-mid项目总结

本文提出"agent-mid"项目，这是一个用于变更风险评估的Go单体仓库（多main模式）架构方案。项目旨在解决当前变更风险控制领域面临的四大挑战：单体仓库规范缺失、技能与规则管理割裂、反馈闭环缺失和基础设施重复建设。架构包含8个核心模块：skill-registry（技能管理）、rule-engine（规则评估）、data-base（观测数据存储）、agent（主决策编排）