LLM JSON Schema实战：构建结构化输出的高效解决方案

01111二进制

0人浏览 · 2026-06-21 03:49:26

01111二进制 · 2026-06-21 03:49:26 发布

当LLM输出变成开发者的噩梦

上周对接某电商客服系统时，我们让LLM生成订单查询响应。理想中的数据结构应该是这样的：

{
  "order_id": "12345",
  "status": "shipped",
  "estimated_delivery": "2023-12-25"
}

但实际收到的是这种自由发挥版本：

{
  "您的订单": "#12345",
  "当前状态": "已发货",
  "预计到达时间": "圣诞节当天"
}

非结构化数据问题示例

为什么选择JSON Schema

| 方案 | 开发成本 | 可维护性 | 错误定位 | 扩展性 | |----------------|----------|----------|----------|--------| | 正则表达式 | 高 | 差 | 困难 | 弱 | | 自定义解析器 | 中 | 中 | 一般 | 中 | | JSON Schema | 低 | 优秀 | 精确 | 强 |

核心实战四步走

1. Schema语法三件套

{
  "$schema": "http://json-schema.org/draft-07/schema#",
  "type": "object",
  "required": ["order_id", "status"],
  "properties": {
    "order_id": {
      "type": "string",
      "pattern": "^\\d{5}$"
    },
    "status": {
      "enum": ["processing", "shipped", "delivered"]
    }
  }
}

2. 与LangChain集成示例

from langchain.output_parsers import StructuredOutputParser
from jsonschema import validate

schema = {
    # 上述schema定义
}

def validate_with_retry(llm_output, max_retries=3):
    for attempt in range(max_retries):
        try:
            validate(instance=llm_output, schema=schema)
            return llm_output
        except Exception as e:
            print(f"Attempt {attempt + 1} failed: {str(e)}")
            # 这里可以加入自动修正逻辑
    raise ValueError("Max retries exceeded")

代码验证流程

3. 动态Schema生成

def build_dynamic_schema(user_query):
    base_schema = {
        "type": "object",
        "properties": {}
    }

    if "日期" in user_query:
        base_schema["properties"]["date"] = {
            "type": "string",
            "format": "date"
        }

    return base_schema

4. 性能优化三板斧

Schema缓存：使用@lru_cache装饰器缓存编译后的验证器
批量验证：采用jsonschema.Draft7Validator预编译实例

框架集成：FastAPI示例：

@app.post("/validate")
async def validate_data(data: dict):
    try:
        validate(instance=data, schema=settings.SCHEMA)
        return {"status": "valid"}
    except ValidationError as e:
        return JSONResponse(
            status_code=422,
            content={"detail": e.message}
        )

生产环境血泪教训

递归深度：限制$ref嵌套不超过5层
字符集陷阱：始终指定"contentEncoding": "UTF-8"
版本管理：使用$schema字段声明版本

终极思考题

我们是否应该允许LLM在additionalProperties: false时依然能创造性地返回metadata字段？这个平衡点该如何把握？

架构思考

音视频领域的无限可能，等你我来创造！

音视频技术社区，一个全球开发者共同探讨、分享、学习音视频技术的平台，加入我们，与全球开发者一起创造更加优秀的音视频产品！

更多推荐

LLM Inference Unveiled：从零构建高效推理服务的核心原理与实践

为什么LLM推理服务如此具有挑战性？大型语言模型（LLM）推理面临三大核心挑战：高延迟（用户等待响应时间过长）、低吞吐（单位时间处理的请求量不足）和高成本（GPU显存/GPU Memory资源消耗过大）。这些因素直接影响用户体验和商业可行性。框架选型：PyTorch vs TensorRT vs ONNX Runtime PyTorch 优势：原生支持动态计算图，调试方便；劣势：默认未优化，

音视频技术专区

实战指南：如何通过Google插件实现连续网页视频点播下一集

最近在追剧时，每次看完一集都要手动点下一集，感觉特别麻烦。于是研究了下如何用Chrome插件实现自动连续播放，现在把开发过程整理成笔记分享给大家。一、为什么需要这个功能手动操作痛点：大多数视频网站虽然提供自动连播功能，但有些需要会员，有些会中途插播广告场景需求：适合追剧、网课学习等需要连续观看的场景技术可行性：现代浏览器提供了完善的扩展API和DOM操作能力二、技术方案选择对比几种常见方

音视频技术专区

如何通过Google插件实现连续网页视频点播下一集：自动化效率提升方案

作为一名经常在网页上追剧的用户，最烦的就是每集结束都要手动点击下一集。尤其是在深夜追剧时，困得睁不开眼还要找那个小小的下一集按钮，简直让人崩溃。于是，我决定开发一个Google插件来自动化这个流程，今天就把这个实战经验分享给大家。为什么需要这个插件手动点击下一集主要有三个痛点：打断观影体验：每次都要等待片尾，然后找按钮点击容易错过：有时候片尾会自动跳过，手动操作来不及移动端不友好：在小屏幕