AI Agent 输出格式的隐形瓶颈

在生产环境中，一个长运行的 AI Agent 每天执行十几轮 cron 任务，生成 2000 字的详细报告——扫描时间线、聚合关键信息、输出风险与下一步行动。内容完全正确，可当这一切被一股脑塞进 Telegram 时，你却发现自己根本读不下去：重要决策被埋在长墙文本里，上下文切换成本爆炸式上升，一天下来脑力直接见底。团队明明已经用了结构化 Prompt 和总结约束，却依然卡在“输出可读性”这个最不

紫微AI

838人浏览 · 2026-05-20 20:54:36

紫微AI · 2026-05-20 20:54:36 发布

Markdown 作为源代码够用，但人类审查表面为什么总崩溃？

我起初也和大多数 Agent 开发者一样，认为 Markdown 就是最佳选择。它简单、diff 友好、token 消耗低、跨 Agent 传递方便，改输出格式纯属多此一举。后来我读到 Thariq 那篇《Using Claude Code: The Unreasonable Effectiveness of HTML》，又刷到 html-anything 这个仓库的标语“Markdown is the draft, HTML is what humans read”，才猛然醒悟：我们一直把 Markdown 当成了终点，却忘了它只是给 AI 读的源代码，而人类真正需要的是可直接消费的交付物。

生活里这就像程序员写完源码后，直接把 .py 文件发给产品经理审阅——代码逻辑没错，但对方根本没法高效理解意图。真正的交付物，永远是渲染后的、结构清晰的界面。

Markdown 与 HTML 的底层职责拆解

Agent 的输出从来不是单一产物，而是三层职责分离后的产物：

源代码层（Markdown）：持久化的事实层，供下一个 Agent 读取、grep、索引、版本控制。它保持极致轻量和可机器处理。
人类交付层（HTML）：审查表面，供人快速扫描、决策、转发。它保留视觉层级、链接、表格、醒目风险提示，让 2000 字内容能在 30 秒内被有效吸收。
通知层（Telegram 5 行摘要）：只扔 verdict、当前状态、下一步行动，绝不塞正文。

三者分离后，Agent 一次运行就能同时留下“可被 AI 继续消费的源头”和“可被人类直接签收的成品”。这才是真正的 artifact contract（交付契约）。

下面是我重构后的输出交付函数示例（生产环境中已落地，核心逻辑极简）：

# Agent 输出交付契约核心函数（Markdown + HTML + 通知分离）
def deliver_agent_output(stage_data: dict, run_context: dict):
    # 1. Markdown 作为源代码 - 持久化给下一个 Agent
    markdown_path = f"content/memory/daily/{stage_data['stage']}_{datetime.now():%H%M}.md"
    with open(markdown_path, "w", encoding="utf-8") as f:
        f.write(stage_data["full_markdown"])  # 包含完整链路、风险、决策依据
    
    # 2. HTML 作为人类审查表面 - 渲染后存入 outbound 目录
    html_content = render_to_html(
        stage_data, 
        template="agent_report.html",  # 包含 source chain、风险高亮、确认按钮等结构
        user_direction=run_context["today_direction"]
    )
    html_path = f"gateway/outbound/{stage_data['stage']}.html"
    with open(html_path, "w", encoding="utf-8") as f:
        f.write(html_content)
    
    # 3. Telegram 只发极简通知
    telegram_summary = f"""
    ✅ {stage_data['stage']} 完成
    状态：{stage_data['verdict']}
    风险：{len(stage_data['risks'])} 项
    下一步：{stage_data['next_action']}
    查看完整报告：{html_path}
    """
    send_telegram(telegram_summary)
    
    return {"markdown": markdown_path, "html": html_path}

渲染开销实测仅 51ms（22.4KB Markdown 源文件，本地读取 0.016ms，Markdown-to-HTML 转换 50.8ms）。对动辄几分钟的 Agent 任务来说，这几乎是噪声级别。

Markdown-only vs Artifact Contract 的真实权衡矩阵

评估维度	传统 Markdown-only 输出（塞聊天工具）	新 Artifact Contract（Markdown+HTML+通知）
实测性能与架构参数	零额外渲染，token 极省	51ms 渲染开销，几乎无感知；持久化更清晰
长尾风险与潜在技术债	人类审查疲劳导致决策遗漏、重复劳动	源代码与交付物解耦，长生命周期 Agent 状态可追溯
开发者心智负担与上手门槛	每天盯着墙文本，脑力快速耗尽	阅读体验指数级提升，审查变成“签收”而非“苦读”