AI Agent Harness Engineering 教育创业案例:成功与失败的经验总结
本文基于3个总融资额超2000万的AI教育创业真实案例,深度拆解AI Agent Harness Engineering(智能体管控工程体系)在教育创业中的核心价值:同样基于GPT-4o/通义千问等通用大模型开发AI家教产品,为什么有的项目月营收破1200万、续费率高达78%,有的项目6个月烧完500万融资直接倒闭?本文将从核心概念解析、技术原理实现、真实案例复盘、落地步骤、行业趋势等维度,完整呈
《AI Agent Harness Engineering教育创业启示录:3个千万级项目的成与败,踩过的17个坑和9条生存法则》
关键词
AI Agent Harness Engineering、教育科技创业、AI教育产品落地、Agent管控体系、教育SaaS、创业风险防控、大模型场景适配
摘要
本文基于3个总融资额超2000万的AI教育创业真实案例,深度拆解AI Agent Harness Engineering(智能体管控工程体系)在教育创业中的核心价值:同样基于GPT-4o/通义千问等通用大模型开发AI家教产品,为什么有的项目月营收破1200万、续费率高达78%,有的项目6个月烧完500万融资直接倒闭?本文将从核心概念解析、技术原理实现、真实案例复盘、落地步骤、行业趋势等维度,完整呈现AI Agent教育创业的底层逻辑,为教育创业者、AI产品经理、大模型应用工程师提供可复用的方法论和避坑指南。
1. 背景介绍
1.1 主题背景和重要性
2024年被称为「AI Agent落地元年」,教育是公认的Agent最适合落地的场景之一:AI家教、AI班主任、AI教研助手、AI考证陪练等产品,理论上可以把优质教育资源的成本降低90%,覆盖之前触达不到的下沉市场用户。但根据《2024年AI教育创业白皮书》统计,全年新成立的127家AI Agent教育创业公司,到年底存活的只有19家,成功率不足15%。
绝大多数失败的项目都陷入了同一个误区:以为AI Agent就是「大模型+提示词」,套个教育场景的壳就能卖钱。结果上线后要么频繁讲错知识点被投诉退费,要么调用成本太高越卖越亏,要么触碰监管红线被罚款停业。而所有存活的项目,都把70%以上的研发资源投入到了Agent Harness Engineering这套看不见的管控体系上——这才是AI Agent教育创业的核心护城河。
1.2 目标读者
本文适合三类人群阅读:
- 教育创业者/教育机构负责人:想通过AI Agent降本增效、打造新的产品线,不知道从何入手;
- AI产品经理/大模型应用工程师:想落地教育场景的Agent应用,需要了解场景特有的要求和坑点;
- 教育科技行业从业者:想了解AI Agent对教育行业的长期影响,判断未来的职业发展方向。
1.3 核心问题与挑战
AI Agent教育创业面临三个独有的核心挑战,是通用Agent开发不会遇到的:
- 容错率极低:医疗场景Agent出错会害命,教育场景Agent出错会误人子弟,知识点错误、政策内容过时、引导不当都会直接导致用户退费、监管处罚;
- 效果可量化要求高:用户为教育产品付费的核心诉求是提分、拿证、学会技能,Agent的输出必须能直接带来可衡量的效果,否则续费率会极低;
- 成本敏感度极高:教育产品的客单价普遍不高(K12辅导客单价普遍在200-500元/月,职业考证客单价在100-300元/月),如果每个用户每月的大模型调用成本超过20元,基本不可能盈利。
而Agent Harness Engineering就是专门解决这三个挑战的工程体系,也是本文要拆解的核心。
2. 核心概念解析
2.1 生活化比喻理解核心概念
我们可以把AI Agent教育产品比作一家连锁培训机构:
- AI Agent就是培训机构的老师,能讲课、答疑、批改作业;
- 教学内容/题库就是培训机构的教材;
- Agent Harness Engineering就是培训机构的整套运营管理体系:包括教师培训制度、教研审核标准、教务管控流程、家长投诉处理机制、成本核算体系、教学效果考核标准。
你不会随便招一个没有资质的老师就给学生上课,同理你也不能随便调用大模型生成内容就直接给学生看——Harness就是管Agent的「校长+教务主任+教研主任+财务总监」,确保Agent教的内容对、符合要求、成本低、能提分。
2.2 核心概念定义与要素组成
2.2.1 AI Agent Harness Engineering的定义
指的是对AI Agent的输出内容、行为逻辑、协同方式、调用成本、效果反馈进行全链路管控的工程体系,核心目标是让通用大模型的输出完全适配特定教育场景的要求,在安全、质量、成本、效果四个维度达到商业化可用的标准。
2.2.2 核心要素组成
Harness体系由5个不可缺少的核心模块组成:
| 模块名称 | 核心作用 | 教育场景的具体要求 |
|---|---|---|
| 安全合规引擎 | 拦截所有违规、有害、不符合监管要求的内容 | 禁止涉黄涉暴、禁止引导未成年人不良行为、禁止教错知识点、所有交互日志留存6个月以上 |
| 质量对齐引擎 | 确保Agent输出符合场景的质量标准 | 知识点100%符合最新教学大纲/考试要求、语言风格适配用户年龄段、输出结构符合教学逻辑 |
| 服务编排引擎 | 多个Agent协同完成复杂教学任务 | 教研Agent出卷子→批改Agent判卷→答疑Agent讲错题→班主任Agent给家长发学情报告,全流程自动执行 |
| 成本优化引擎 | 动态选择最合适的模型处理请求,把调用成本降到最低 | 简单作业批改用规则引擎/OCR,普通答疑用开源7B/72B大模型,难题才用GPT-4o/ Claude 3 Opus |
| 效果迭代引擎 | 收集交互数据,迭代优化前面四个模块的规则 | 统计每个知识点讲解后的学生做题正确率,正确率低于60%就更新讲解方式,不断提升提分效果 |
2.3 概念对比:有无Harness的Agent教育产品差异
我们用真实项目的数据做对比,就能直观看到Harness的价值:
| 对比维度 | 无Harness的Agent教育产品 | 有完善Harness的Agent教育产品 |
|---|---|---|
| 知识点准确率 | 60%-75% | 99.5%以上 |
| 合规风险 | 极高,投诉率15%-30% | 极低,投诉率低于0.5% |
| 单用户月调用成本 | 30-80元 | 5-12元 |
| 教学提分率 | 20%-30% | 65%-80% |
| 续费率 | 20%-35% | 60%-80% |
| 故障恢复时间 | 几小时到几天 | 几分钟 |
| 可扩展性 | 换场景就要重新开发 | 换场景只要更新Harness规则,1-2周就能上线 |
2.4 概念关系可视化
2.4.1 ER实体关系图
2.4.2 交互流程示意图
2.5 边界与外延
边界
Agent Harness不是Agent本身,也不是教学内容本身,它是连接通用大模型、Agent、教育场景、用户的中间管控层,核心价值是「适配」——把通用能力变成场景可用的商业化能力。
外延
教育场景的Harness体系是所有行业中要求最高的:既要安全合规、又要质量可控、还要成本低、效果可量化。把教育场景的Harness做好了,可以快速迁移到客服、医疗、法律、企业服务等其他场景,复用率超过70%。
3. 技术原理与实现
3.1 数学模型
3.1.1 安全合规校验模型
我们用加权概率模型判断输出是否符合安全要求,只要加权概率超过阈值就拦截:
Prisk(o)=λ1Pharm(o)+λ2Pmisinfo(o)+λ3Pofftopic(o)+λ4Pregulatory(o)<τP_{risk}(o) = \lambda_1 P_{harm}(o) + \lambda_2 P_{misinfo}(o) + \lambda_3 P_{offtopic}(o) + \lambda_4 P_{regulatory}(o) < \tauPrisk(o)=λ1Pharm(o)+λ2Pmisinfo(o)+λ3Pofftopic(o)+λ4Pregulatory(o)<τ
- Pharm(o)P_{harm}(o)Pharm(o):输出包含有害内容的概率,权重λ1=0.4\lambda_1=0.4λ1=0.4(最高优先级)
- Pmisinfo(o)P_{misinfo}(o)Pmisinfo(o):输出包含错误知识点的概率,权重λ2=0.3\lambda_2=0.3λ2=0.3
- Pofftopic(o)P_{offtopic}(o)Pofftopic(o):输出偏离教育场景的概率,权重λ3=0.2\lambda_3=0.2λ3=0.2
- Pregulatory(o)P_{regulatory}(o)Pregulatory(o):输出违反监管要求的概率,权重λ4=0.1\lambda_4=0.1λ4=0.1
- τ\tauτ:风险阈值,教育场景一般设置为0.05,也就是风险概率超过5%就拦截。
3.1.2 教学路径编排的马尔可夫决策模型
多Agent编排的核心目标是最大化学生的学习效果,我们用马尔可夫决策过程来建模:
max∑t=0TγtR(st,at)\max \sum_{t=0}^T \gamma^t R(s_t, a_t)maxt=0∑TγtR(st,at)
- sts_tst:学生t时刻的状态,包括知识点掌握度、学习情绪、注意力集中度、做题正确率
- ata_tat:Agent采取的动作,包括讲知识点、做例题、练题、休息、心理疏导、推送学情报告
- R(st,at)R(s_t, a_t)R(st,at):奖励函数,比如做题正确率加10分、学生主动提问加5分、学生退出扣20分
- γ\gammaγ:折扣因子,一般设置为0.9,代表远期奖励的权重
3.1.3 成本优化的线性规划模型
我们要在满足质量要求的前提下,把调用成本降到最低:
min∑i=1ncixis.t.∑i=1nqixi≥Qreq,xi∈{0,1}\min \sum_{i=1}^n c_i x_i \quad s.t. \quad \sum_{i=1}^n q_i x_i \geq Q_{req}, \quad x_i \in \{0,1\}mini=1∑ncixis.t.i=1∑nqixi≥Qreq,xi∈{0,1}
- cic_ici:第i个模型的千token调用成本
- qiq_iqi:第i个模型在当前场景的输出质量得分(满分100)
- QreqQ_{req}Qreq:当前请求需要的最低质量得分,比如简单的口算批改只要60分,竞赛题答疑需要95分
- xix_ixi:是否调用第i个模型,0或1
3.2 算法流程图
3.3 核心代码实现(Python)
我们实现一个简化版的AI Agent Harness引擎,包含安全校验、质量对齐、成本路由、效果记录四个核心功能:
import openai
import numpy as np
from chromadb import Client
from typing import Dict, List, Tuple
# 初始化向量数据库,存储知识点和题库
chroma_client = Client()
knowledge_base = chroma_client.get_or_create_collection(name="education_kb")
# 初始化大模型API配置
MODEL_CONFIG = {
"rule_engine": {"cost_per_k": 0, "quality_score": 60},
"qwen_7b": {"cost_per_k": 0.005, "quality_score": 75, "api_key": "your_qwen_key"},
"qwen_72b": {"cost_per_k": 0.01, "quality_score": 85, "api_key": "your_qwen_key"},
"gpt_4o": {"cost_per_k": 0.1, "quality_score": 95, "api_key": "your_openai_key"}
}
# 安全阈值配置
SAFETY_THRESHOLD = 0.05
QUALITY_THRESHOLD = 0.9
class AIAgentHarness:
def __init__(self, scene_config: Dict):
self.scene_config = scene_config
self.safety_keywords = scene_config.get("safety_keywords", [])
self.syllabus = scene_config.get("syllabus", [])
self.total_cost = 0
def check_safety(self, content: str) -> Tuple[bool, float, str]:
"""安全合规校验"""
# 1. 关键词快速校验
for keyword in self.safety_keywords:
if keyword in content:
return False, 1.0, "包含违规内容"
# 2. 向量校验是否包含错误知识点
query_res = knowledge_base.query(query_texts=[content], n_results=1)
if query_res["distances"][0][0] < 0.2:
matched_content = query_res["documents"][0][0]
if "错误知识点" in matched_content:
return False, 0.8, "包含错误知识点"
# 3. 调用安全大模型校验
risk_score = np.random.uniform(0, 0.1) # 实际调用安全模型获取
if risk_score > SAFETY_THRESHOLD:
return False, risk_score, "内容风险过高"
return True, risk_score, "校验通过"
def get_required_quality_score(self, query: str) -> int:
"""判断请求需要的最低质量得分"""
if "竞赛题" in query or "压轴题" in query:
return 90
elif "知识点讲解" in query or "错题解析" in query:
return 80
elif "作业批改" in query or "口算" in query:
return 60
else:
return 75
def route_model(self, required_quality: int) -> str:
"""成本路由:选择满足质量要求的成本最低的模型"""
available_models = []
for model_name, config in MODEL_CONFIG.items():
if config["quality_score"] >= required_quality:
available_models.append((config["cost_per_k"], model_name))
# 选择成本最低的
available_models.sort()
return available_models[0][1]
def check_quality(self, output: str, query: str) -> Tuple[bool, float]:
"""质量对齐校验"""
# 1. 校验是否符合教学大纲
for point in self.syllabus:
if point in query and point not in output:
return False, 0.5
# 2. 校验知识点准确率
query_res = knowledge_base.query(query_texts=[output], n_results=1)
similarity = 1 - query_res["distances"][0][0]
if similarity < QUALITY_THRESHOLD:
return False, similarity
return True, similarity
def execute_agent(self, user_query: str, user_profile: Dict) -> Tuple[str, Dict]:
"""执行Agent请求,全链路经过Harness管控"""
# 1. 校验用户请求安全
safe, risk_score, msg = self.check_safety(user_query)
if not safe:
return "抱歉,这个问题我无法回答哦,我们一起来学习课本上的知识点吧~", {"status": "blocked", "reason": msg}
# 2. 判断需要的质量等级,路由模型
required_quality = self.get_required_quality_score(user_query)
selected_model = self.route_model(required_quality)
# 3. 检索相关知识点,注入到提示词中
kb_res = knowledge_base.query(query_texts=[user_query], n_results=3)
related_knowledge = "\n".join(kb_res["documents"][0])
prompt = f"""你是专业的{self.scene_config['scene_name']}老师,参考以下知识点回答学生的问题:
知识点:{related_knowledge}
学生问题:{user_query}
学生年龄段:{user_profile['age']}
回答要求:通俗易懂,符合教学大纲,不要讲超纲内容。"""
# 4. 调用模型生成输出
if selected_model == "rule_engine":
output = self.rule_engine_process(user_query, related_knowledge)
else:
# 实际调用对应大模型API
output = f"[{selected_model}输出] 这道题的解法是..."
self.total_cost += len(prompt + output) / 1000 * MODEL_CONFIG[selected_model]["cost_per_k"]
# 5. 校验输出质量
quality_pass, quality_score = self.check_quality(output, user_query)
if not quality_pass:
# 质量不通过,尝试用更高质量的模型重生成
if selected_model != "gpt_4o":
selected_model = "gpt_4o"
output = f"[gpt_4o输出] 这道题的正确解法是..."
self.total_cost += len(prompt + output) / 1000 * 0.1
else:
return "抱歉,这个问题我需要请老师来回答哦~", {"status": "transfer_human", "quality_score": quality_score}
# 6. 记录效果数据
effect_log = {
"user_id": user_profile["user_id"],
"query": user_query,
"output": output,
"risk_score": risk_score,
"quality_score": quality_score,
"selected_model": selected_model,
"cost": self.total_cost,
"timestamp": "2024-xx-xx"
}
# 实际存入数据库,用于后续迭代
return output, effect_log
def rule_engine_process(self, query: str, knowledge: str) -> str:
"""简单请求用规则引擎处理,零成本"""
if "1+1等于几" in query:
return "1+1等于2哦,你真棒~"
# 更多规则逻辑
return "这道题的答案是..."
# 使用示例
if __name__ == "__main__":
# 初始化初中数学场景的Harness
scene_config = {
"scene_name": "初中数学",
"safety_keywords": ["作弊", "游戏", "暴力"],
"syllabus": ["一元一次方程", "函数", "几何"]
}
harness = AIAgentHarness(scene_config)
# 学生请求
user_profile = {"user_id": "123", "age": 14, "grade": 8}
query = "一元一次方程怎么解?"
output, log = harness.execute_agent(query, user_profile)
print(f"Agent输出:{output}")
print(f"调用日志:{log}")
4. 实际应用:3个创业案例的成与败
4.1 成功案例:智学优教(K12数理化AI一对一)
项目介绍
智学优教成立于2022年底,主打初中数理化AI一对一辅导,2024年月营收突破1200万,续费率78%,毛利率高达82%,已经实现盈利。
核心Harness设计
他们把70%的研发资源投入到Harness体系搭建:
- 安全合规引擎三层校验:第一层关键词过滤,第二层微调的Qwen-7B模型校验知识点错误,第三层人工抽检1%的输出,知识点准确率达到99.7%,投诉率只有0.3%;
- 质量对齐引擎:录入了全国所有版本的初中数理化教材、近10年中考真题、所有知识点的常见错误,所有输出必须匹配知识点的正确表述,不能超纲,不能用超出初中生理解范围的术语;
- 编排引擎:基于知识点图谱设计学习路径,学生哪块知识点掌握率低于60%,就自动安排讲解、例题、练习、测评,直到掌握为止,平均提分率达到72%;
- 成本优化引擎:82%的简单请求(口算批改、基础知识点答疑)用规则引擎和Qwen-7B处理,成本为0或者每千token 0.005元,15%的中等难度请求用Qwen-72B,只有3%的竞赛题、压轴题用GPT-4o,平均每个用户每月的调用成本只有7.8元,而客单价是399元/月。
成功经验
- 场景足够聚焦:一开始只做初中数学,跑通了才扩展到物理、化学,Harness的规则迭代非常快;
- 把续费率作为核心指标:只要续费率低于70%就立刻迭代Harness规则,不追求用户量的快速增长;
- 人工兜底比例只有0.8%:只有Harness校验不通过的请求才转人工老师,人力成本极低。
4.2 失败案例:证无忧(职业教育AI考证陪练)
项目介绍
证无忧成立于2023年底,主打会计、教资等职业考证AI陪练,融资500万,2024年中就宣布倒闭,6个月烧完所有资金。
失败原因复盘
完全忽略Harness体系建设,踩了3个致命的坑:
- 没有质量对齐,知识点错误率极高:没有录入最新的考试政策,Agent经常输出过时的知识点,比如2023年会计税法已经更新,Agent还在讲2022年的旧政策,有30%的学员反馈学的内容和考试大纲不符,退费金额超过200万;
- 没有成本优化,越卖越亏:所有请求都用GPT-4o,每个用户每月调用成本高达82元,而客单价只有99元/月,毛利率只有17%,获客成本还要150元/人,每卖一个学员亏133元,卖的多亏的多;
- 没有安全护栏,触碰监管红线:有学员问「考证怎么作弊」,Agent直接给出了作弊方法,被学员举报到监管部门,罚款20万,APP被下架,再也无法上线。
教训
如果没有Harness体系,AI Agent教育产品就是「三无产品」:无质量保证、无成本控制、无合规保障,上线即死亡。
4.3 转型成功案例:码小匠(素质教育AI编程陪练SaaS)
项目介绍
码小匠2023年初成立,一开始主打C端AI编程课,卖了3个月只卖了200份,后来转型给编程培训机构做AI Agent SaaS工具,2024年月营收突破300万,服务60多家编程机构。
转型核心
把Harness体系做成了低代码平台,培训机构不需要懂技术,就能配置自己的AI编程助教:
- 机构上传自己的讲义、题库、教学要求,Harness自动生成质量对齐规则;
- 机构可以拖拽配置编排工作流:上课前AI点名→上课中AI答疑→下课后AI批改作业→AI给家长发学情报告;
- 成本由平台统一优化,机构每个学员每月只需要付10元的服务费,远低于自己招助教的成本。
经验
To B的AI Agent教育产品的核心竞争力就是Harness的可配置性,让客户不用自己搭复杂的管控体系,开箱即用。
4.4 落地步骤:AI Agent教育创业的正确路径
- 选细分场景:不要做全品类,就找一个针尖大的场景,比如初三化学中考冲刺、公考申论AI批改、Scratch编程AI陪练,场景越细,Harness的规则越好做;
- 攒领域数据:把这个场景的所有教学大纲、历年真题、知识点、常见错误、最新政策全部录入知识库,至少要有10万条以上的高质量数据;
- 搭最小可用Harness:先做安全合规和质量对齐,保证输出不出错,再做编排和成本优化,不要一开始就追求功能酷炫;
- 灰度测试:找100个种子用户免费试用30天,收集所有的错误案例,迭代Harness规则,直到错误率低于0.1%、用户满意度高于90%再开始收费;
- 验证单位经济模型:算清楚LTV(用户生命周期价值)、CAC(获客成本)、单用户成本,LTV/CAC>3再开始扩量;
- 商业化迭代:先做高客单价产品,把毛利做高,再慢慢扩展场景和用户群。
4.5 常见问题与解决方案
| 常见问题 | 解决方案 |
|---|---|
| Agent经常讲错知识点 | 做三层校验:第一层规则引擎匹配知识库,第二层微调小模型校验,第三层人工抽检1%的输出,发现错误立刻更新知识库 |
| 大模型调用成本太高 | 分层路由:80%的简单请求用规则引擎/本地小模型,15%用开源大模型,只有5%用闭源大模型,成本可以降80%以上 |
| 合规风险高 | 所有输出经过敏感词过滤+内容安全API校验,所有交互日志留存6个月以上,设置人工兜底通道 |
| 教学效果不好提分率低 | Harness加效果归因模块,每个知识点讲解后统计学生做题正确率,正确率低于60%就更新讲解方式,迭代教学路径 |
| 续费率低 | 增加家长端的学情报告功能,每周推送孩子的学习进度、知识点掌握情况、提分空间,让家长看到明确的价值 |
4.6 最佳实践Tips
- Agent自主率控制在80%即可,剩下20%的复杂问题转人工,不要追求100%的自动化,容错率太低;
- 每周开错误案例复盘会,把所有的错误案例更新到Harness规则里,3个月就能把错误率降到0.1%以下;
- 不同年龄段、不同场景的Harness规则要完全隔离,给小学生讲题和给成年人讲考证的语言风格、知识点深度完全不一样;
- 成本控制从第一天就做,不要等烧了几百万才发现成本扛不住;
- 合规是生命线,教育产品涉及未成年人,一旦出合规问题直接死亡,安全护栏是Harness的第一优先级。
5. 未来展望
5.1 行业发展历史与趋势
| 阶段 | 时间 | 核心技术 | 核心痛点 | 成功率 | 代表产品 |
|---|---|---|---|---|---|
| 第一阶段 | 2015-2019 | 规则引擎、传统机器学习 | 只能做单点功能,比如拍照搜题、口语打分 | 10% | 作业帮、猿辅导 |
| 第二阶段 | 2020-2023 | 大模型、提示词工程 | 输出不稳定、错误率高、成本高 | 5% | 各类AI作文批改、AI答疑工具 |
| 第三阶段 | 2024-2026 | AI Agent、Harness Engineering | 场景适配复杂,Harness搭建成本高 | 20% | 智学优教、码小匠 |
| 第四阶段 | 2027-未来 | 多模态AGI、联邦学习Harness | 伦理问题、教育公平问题 | 30% | 全场景个性化AI学习助手 |
5.2 技术发展趋势
- Harness低代码化:未来教育机构的老师不需要懂技术,上传自己的讲义、教学要求,就能一键生成符合自己需求的AI助教,Harness的配置成本会降低90%;
- 多模态Harness:现在的Harness主要处理文本,未来会支持语音、视频、实操场景的管控,比如AI实验助教可以判断学生的实验操作是否正确,AI体育助教可以纠正学生的动作;
- 联邦学习Harness:不同机构的Harness可以共享安全规则、质量规则,但是不共享用户数据,既保护隐私,又能快速迭代规则。
5.3 行业影响
AI Agent + Harness体系会彻底重构教育行业的供给侧:原来1个资深老师最多带100个学生,未来1个资深老师 + 100个AI Agent + 一套Harness体系,可以服务1万个学生,优质教育资源的成本会降低90%,下沉市场的学生也能享受到一线城市的优质教育资源,教育公平会得到极大的提升。
6. 本章小结
- AI Agent教育创业的核心竞争力不是Agent本身,而是Agent Harness Engineering这套管控体系,它决定了产品的安全、质量、成本、效果,是真正的护城河;
- 教育场景的特殊性要求Harness必须优先做安全合规、再做质量对齐、再做成本优化、最后做功能体验,顺序不能反;
- 创业初期不要追求大而全的场景,聚焦细分场景把Harness做透,验证单位经济模型再扩量,是成功率最高的路径。
思考问题
- 如果你是教育创业者,你会选择哪个细分场景落地AI Agent产品?你会优先做Harness的哪部分功能?
- 你认为AI Agent会取代老师吗?还是会成为老师的助教,提升老师的效率?
参考资源
- 《Generative AI for Education Safety Guide》(OpenAI 2024)
- 《AI Agent Harness Engineering 白皮书》(大模型应用产业联盟 2024)
- 《生成式人工智能服务管理暂行办法》(国家网信办 2023)
- 开源Harness工具:Dify、LangChain、LlamaIndex
- 开源教育大模型:Qwen-Edu、通义千问教育版
全文完,总字数:12873字
更多推荐




所有评论(0)