个人助理型 AI Agent Harness Engineering 的产品形态演变
专属身份:和单一用户绑定,持续学习用户的偏好、习惯、生活/工作节奏;环境感知:能感知用户所处的设备、位置、网络、日程等上下文信息;自主执行:不需要用户逐步指令,就能自主完成跨应用、跨设备、跨服务的复杂任务。Harness Engineering是AI Agent和用户数字化环境之间的「交互总线工程体系」,负责将Agent的决策转化为对用户环境中各类能力的调用,同时将环境的反馈回传给Agent,核心
个人助理型 AI Agent Harness Engineering 的产品形态演变
引言
痛点引入
你有没有过这样的经历:对着手机里的语音助手说「下周我要去杭州参加云栖大会,帮我安排好行程」,得到的回复却是「我帮你搜了杭州的天气,未来一周晴好」,完全get不到你要订机票、订酒店、同步日历、约当地朋友吃饭的深层需求;你攒了半个月的报销单,要一个个打开携程、美团、滴滴的订单,复制金额、粘贴到报销系统、上传凭证,折腾半小时才能搞定,而你的AI助理只能在旁边看着帮不上忙;你换了新手机,之前的语音助手完全记不住你喜欢坐靠窗的经济舱、住离会场步行10分钟以内的四星酒店、喝三分糖少冰的奶茶,所有偏好要重新设置一遍。
这些痛点的核心,从来都不是AI的理解能力不够——GPT-4o已经能听懂人类99%的自然语言需求——而是AI和用户所处的数字化环境之间,缺少一个能够打通能力、适配偏好、编排流程、保护隐私的中间层,这个中间层就是我们今天要聊的核心:个人助理型AI Agent的Harness Engineering(线束工程/能力挂载工程)。
核心问题
本文将围绕以下核心问题展开讲解:
- 什么是个人助理型AI Agent的Harness Engineering?它和普通的插件系统、低代码平台有什么本质区别?
- 从1990年代最早的PDA助手到今天的大模型原生AI助理,Harness Engineering的产品形态经历了哪几个阶段的演变?每个阶段解决了什么问题、还有哪些痛点?
- 未来5-10年,个人助理型Harness Engineering会向什么方向发展?普通开发者和用户怎么参与到这个领域的建设中?
文章脉络
本文首先会明确Harness Engineering的核心概念、边界与核心组成,然后按照时间线梳理四个发展阶段的技术特点、代表产品、架构设计,结合数学模型、算法流程、代码示例讲解核心实现逻辑,最后分析行业趋势和最佳实践,给开发者和用户提供可落地的指导。
基础概念与核心定义
核心概念
什么是个人助理型AI Agent?
个人助理型AI Agent是面向C端用户、以服务个人全场景数字化需求为目标的自主智能体,它具备三个核心特征:
- 专属身份:和单一用户绑定,持续学习用户的偏好、习惯、生活/工作节奏;
- 环境感知:能感知用户所处的设备、位置、网络、日程等上下文信息;
- 自主执行:不需要用户逐步指令,就能自主完成跨应用、跨设备、跨服务的复杂任务。
什么是Harness Engineering?
Harness Engineering是AI Agent和用户数字化环境之间的「交互总线工程体系」,负责将Agent的决策转化为对用户环境中各类能力的调用,同时将环境的反馈回传给Agent,核心目标是让AI Agent的能力不受限于底层应用、服务、设备的生态壁垒,用最低的成本实现复杂任务的端到端执行。
和普通的插件系统不同,Harness Engineering不是简单的能力挂载工具,而是包含「能力抽象、流程编排、个性化适配、隐私计算、迭代进化」的全链路工程体系。
边界与外延
Harness Engineering的核心边界非常清晰:
- ❌ 它不是大模型本身:不负责核心推理、逻辑判断,只负责决策的落地执行;
- ❌ 它不是应用/服务:不实现具体的业务功能(比如订机票、发消息),只做不同应用能力的串联;
- ❌ 它不是操作系统:不管理硬件资源,只跑在用户态做上层能力的调度。
它的外延可以延伸到个人全场景:从手机、电脑的应用调度,到智能家居、汽车的控制,再到个人数字资产的管理,所有需要AI和外部环境交互的场景,都需要Harness Engineering的支撑。
核心要素组成
个人助理型Harness Engineering由四大核心模块组成:
| 模块名称 | 核心功能 | 设计优先级 |
|---|---|---|
| 能力抽象层 | 把不同来源的能力(本地APP、云SaaS、硬件设备)抽象为统一的接口,屏蔽底层生态差异 | 兼容性 > 性能 |
| 编排引擎层 | 根据用户任务、上下文、偏好生成最优的能力调用流程,处理异常、重试、回滚 | 准确性 > 效率 |
| 个性化适配层 | 加密存储用户的全量偏好数据,持续学习用户的反馈,优化编排策略 | 隐私性 > 准确性 |
| 隐私计算层 | 通过端侧计算、联邦学习、零知识证明等技术,保证用户敏感数据不出端 | 安全性 > 功能性 |
概念关系梳理
核心属性对比
我们把Harness Engineering和常见的相似产品做核心属性对比:
| 产品类型 | 核心目标 | 面向用户 | 个性化能力 | 隐私保护能力 | 编排自主性 | 生态开放性 |
|---|---|---|---|---|---|---|
| Harness Engineering | 实现AI Agent的全场景能力调度 | AI Agent + 个人用户 | 高(单用户专属) | 极高(敏感数据不出端) | 高(自主生成编排流程) | 高(支持任意能力接入) |
| 普通插件系统 | 扩展单一应用的功能 | 应用开发者 | 低(无用户偏好感知) | 低(数据上传到应用服务端) | 低(固定流程调用) | 中(仅支持对应应用的插件) |
| 低代码平台 | 降低应用开发门槛 | 企业开发者 | 低(面向组织流程) | 中(符合企业合规要求) | 低(人工定义流程) | 中(仅支持平台内置组件) |
| 操作系统 | 管理硬件和软件资源 | 所有用户 | 低(系统级通用配置) | 中(依赖系统隐私策略) | 无 | 高(支持任意应用安装) |
实体关系ER图
核心数学模型
Harness Engineering的核心决策逻辑是在给定任务、偏好、可用能力集的约束下,找到效用最大的编排路径,我们用以下数学公式表示:
U(S)=α×Acc(S)+β×Time(S)+γ×Privacy(S)+δ×Personal(S)U(S) = \alpha \times Acc(S) + \beta \times Time(S) + \gamma \times Privacy(S) + \delta \times Personal(S)U(S)=α×Acc(S)+β×Time(S)+γ×Privacy(S)+δ×Personal(S)
其中:
- U(S)U(S)U(S) 是编排路径SSS的总效用,取值范围[0,1];
- Acc(S)Acc(S)Acc(S) 是任务完成准确率,取值范围[0,1],表示任务完成符合用户预期的概率;
- Time(S)Time(S)Time(S) 是时间效率得分,取值范围[0,1],完成时间越短得分越高;
- Privacy(S)Privacy(S)Privacy(S) 是隐私保护得分,取值范围[0,1],敏感数据出端越少得分越高;
- Personal(S)Personal(S)Personal(S) 是偏好匹配得分,取值范围[0,1],越符合用户偏好得分越高;
- α、β、γ、δ\alpha、\beta、\gamma、\deltaα、β、γ、δ 是四个维度的权重,不同发展阶段的权重差异很大,我们后面会详细讲解。
产品形态演变的四个阶段
我们把个人助理型Harness Engineering的发展分为四个阶段,每个阶段的技术、产品、痛点都有非常清晰的特征:
第一阶段:规则驱动时代(1993-2010)
问题背景
这个阶段个人数字化设备刚刚普及,PDA、功能机是主流,用户的数字化需求非常简单,主要是通讯录、日历、备忘录的管理,没有第三方应用生态,所有能力都是系统内置的。
核心痛点
用户需要逐点操作才能完成任务,没有自动化的能力,比如你要加一个日程,需要手动打开日历APP、输入时间、输入标题、保存,没有办法用自然语言一次性完成。
解决方案
这个阶段的Harness是硬编码的有限状态机,所有的逻辑都是开发者提前写死的,只能匹配预设的规则。比如Apple 1993年推出的Newton PDA的助理,诺基亚2007年推出的语音小助手,微软的Office助手Clippy,都是这个阶段的代表产品。
架构设计
架构非常简单,就是集中式的硬编码架构,逻辑和能力完全耦合:
核心特点
- 权重配置:α=0.8,β=0.1,γ=0.05,δ=0.05\alpha=0.8, \beta=0.1, \gamma=0.05, \delta=0.05α=0.8,β=0.1,γ=0.05,δ=0.05,几乎只关注任务的准确率,其他维度完全不重要;
- 能力范围:仅支持系统内置的10-20个能力,无法扩展;
- 任务处理:仅支持单步固定指令,无法处理复杂的多步任务、条件判断任务。
典型痛点
- 只能处理预设指令,稍微超出规则范围就无法响应;
- 没有任何个性化能力,所有用户的逻辑完全一致;
- 扩展性极差,新增能力需要修改整个系统的代码。
这个阶段的单任务完成率不到30%,用户满意度只有3分(10分制),本质上只是一个「快捷指令集合」,算不上真正的Harness。
第二阶段:API编排时代(2011-2020)
问题背景
智能手机普及,移动互联网爆发,第三方应用生态快速成熟,用户的数字化需求变得复杂,需要跨应用完成任务,比如用微信发消息、用滴滴打车、用携程订机票,用户希望用自然语言就能完成这些操作,不需要逐点打开APP。
核心痛点
不同应用的接口完全不统一,开发者没办法用统一的逻辑调用不同APP的能力,意图识别准确率低,无法理解用户的复杂需求。
解决方案
这个阶段的Harness是云侧集中式的API编排架构,核心是「意图识别+API网关」的组合:首先用语音识别、自然语言理解技术识别用户的意图,然后通过API网关调用第三方服务的开放接口,完成任务。代表产品有Apple Siri、小米小爱同学、Google Assistant、亚马逊Alexa。
架构设计
核心实现代码示例
这个阶段的核心是意图识别,我们用Python实现一个简单的意图分类器:
import jieba
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline
# 训练数据:意图和对应的话术
train_data = [
("订明天北京到上海的机票", "book_flight"),
("帮我查下周一去广州的航班", "book_flight"),
("订陆家嘴附近的酒店", "book_hotel"),
("下周五杭州有没有合适的住宿", "book_hotel"),
("帮我加一个明天下午3点的会议日程", "add_calendar"),
("下周三的约会记到日历里", "add_calendar"),
("今天北京天气怎么样", "query_weather"),
("明天上海会不会下雨", "query_weather")
]
# 数据预处理
texts = [item[0] for item in train_data]
labels = [item[1] for item in train_data]
# 构建意图分类Pipeline
intent_classifier = Pipeline([
('tfidf', TfidfVectorizer(tokenizer=jieba.lcut)),
('classifier', MultinomialNB())
])
# 训练模型
intent_classifier.fit(texts, labels)
# 意图识别接口
def recognize_intent(text: str) -> str:
return intent_classifier.predict([text])[0]
# 测试
if __name__ == "__main__":
test_text = "帮我订下周二去深圳的机票"
intent = recognize_intent(test_text)
print(f"识别到的意图:{intent}")
# 输出:识别到的意图:book_flight
核心特点
- 权重配置:α=0.6,β=0.2,γ=0.1,δ=0.1\alpha=0.6, \beta=0.2, \gamma=0.1, \delta=0.1α=0.6,β=0.2,γ=0.1,δ=0.1,开始关注时间效率和少量的个性化;
- 能力范围:支持第三方开发者上传技能,最多可以扩展到几千个能力;
- 任务处理:支持简单的多步任务,比如订机票之后可以帮你加到日历里。
典型痛点
- 意图识别准确率低,只能识别预设的几百个意图,超出范围就无法处理;
- 跨意图编排能力弱,无法处理需要多个意图串联的复杂任务,比如「订机票+通知秘书接机+订酒店」;
- 隐私风险高,所有的用户语音、数据都要传到云侧处理,容易泄露;
- 个性化能力弱,只能记住少量的用户配置,无法学习用户的深层偏好。
这个阶段的单任务完成率大概是55%,用户满意度5分左右,用户的感知就是「说十句话有五句能听懂,但是只能做简单的事」。
第三阶段:大模型原生编排时代(2021-2024)
问题背景
大语言模型爆发,AI的自然语言理解能力、推理能力实现了质的飞跃,用户希望AI能处理更复杂的端到端任务,比如「帮我把上个月的所有出差订单整理成报销单,提交到公司的报销系统」,而不仅仅是单步的指令响应。
核心痛点
之前的API编排架构的意图识别是固定的,无法适配大模型的灵活推理能力,工具调用幻觉问题严重,编排的流程经常出错,无法匹配用户的个性化偏好。
解决方案
这个阶段的Harness是大模型原生的编排架构,核心是「大模型推理+RAG偏好库+能力适配层」的组合:用大模型做任务理解、编排路径生成,用RAG技术存储和召回用户的偏好,用统一的适配层屏蔽不同服务的接口差异。代表产品有ChatGPT GPTs、AutoGPT个人版、Claude Projects、小米澎湃OS的小爱助理。
架构设计
核心算法流程图
核心实现代码示例
我们用LangChain实现一个简单的大模型原生Harness编排引擎:
from langchain.agents import AgentExecutor, create_openai_tools_agent
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.tools import tool
import json
from typing import List, Dict
# 端侧加密存储的用户偏好,敏感数据不出端
USER_PREFERENCES = {
"user_id": "u12345",
"flight_preference": "economy class, window seat, avoid red-eye flights",
"hotel_preference": "4-star, within 1km of destination, free wifi, no smoking room",
"max_confirmation_steps": 2,
"privacy_level": "high"
}
# 自定义工具:搜索机票
@tool
def search_flights(departure: str, destination: str, date: str) -> List[Dict]:
"""搜索符合条件的机票,参数:出发地 departure,目的地 destination,日期 date(格式YYYY-MM-DD)"""
# 实际调用携程/飞常准API
return [
{"flight_no": "CA1234", "departure_time": "08:00", "arrival_time": "10:30", "price": 890, "seat_type": "economy", "window_available": True},
{"flight_no": "MU5678", "departure_time": "14:00", "arrival_time": "16:40", "price": 750, "seat_type": "economy", "window_available": False}
]
# 自定义工具:搜索酒店
@tool
def search_hotels(location: str, checkin_date: str, checkout_date: str) -> List[Dict]:
"""搜索符合条件的酒店,参数:位置 location,入住日期 checkin_date,退房日期 checkout_date"""
# 实际调用美团/携程API
return [
{"name": "杭州云栖小镇国际酒店", "distance": "0.5km", "star": 4, "price": 680, "free_wifi": True},
{"name": "杭州滨江希尔顿", "distance": "1.2km", "star": 5, "price": 1280, "free_wifi": True}
]
# 自定义工具:添加日历行程
@tool
def add_calendar_event(title: str, start_time: str, end_time: str, location: str) -> str:
"""添加日程到用户本地日历,参数:标题 title,开始时间 start_time,结束时间 end_time,位置 location"""
# 调用端侧系统API,不需要云侧参与
return f"已添加日程:{title},时间:{start_time} 至 {end_time},位置:{location}"
# Harness核心实现
class PersonalHarness:
def __init__(self, user_preferences: Dict):
self.user_preferences = user_preferences
self.llm = ChatOpenAI(model="gpt-4o", temperature=0)
self.tools = [search_flights, search_hotels, add_calendar_event]
# 注入用户偏好到系统提示词
prompt = ChatPromptTemplate.from_messages([
("system", f"""你是用户的专属个人助理,所有操作必须严格遵循用户偏好:
{json.dumps(user_preferences, ensure_ascii=False)}
1. 所有选择优先匹配用户偏好,不符合的选项直接过滤;
2. 最多只需要用户确认{user_preferences['max_confirmation_steps']}次,尽可能自主完成任务;
3. 敏感操作(比如支付)必须经过用户确认;
4. 每一步操作都要向用户解释原因。
"""),
("user", "{input}"),
MessagesPlaceholder(variable_name="agent_scratchpad"),
])
self.agent = create_openai_tools_agent(self.llm, self.tools, prompt)
self.agent_executor = AgentExecutor(agent=self.agent, tools=self.tools, verbose=True)
def run_task(self, task: str) -> str:
return self.agent_executor.invoke({"input": task})["output"]
# 测试
if __name__ == "__main__":
harness = PersonalHarness(USER_PREFERENCES)
result = harness.run_task("下周一会我要去杭州云栖小镇参加云栖大会,帮我安排行程")
print(result)
运行之后的输出大概是:
已为你安排下周一云栖大会的行程:
1. 航班:CA1234,08:00北京起飞10:30到达杭州,经济舱靠窗座位,价格890元,符合你不要红眼航班、靠窗的偏好;
2. 酒店:杭州云栖小镇国际酒店,步行到会场0.5km,四星,680元/晚,有免费WiFi,符合你的酒店偏好;
3. 已将行程添加到你的本地日历。
是否需要为你预订机票和酒店?
核心特点
- 权重配置:α=0.4,β=0.2,γ=0.2,δ=0.2\alpha=0.4, \beta=0.2, \gamma=0.2, \delta=0.2α=0.4,β=0.2,γ=0.2,δ=0.2,隐私和个性化的权重大幅提升;
- 能力范围:支持任意第三方能力接入,生态完全开放;
- 任务处理:支持复杂的多步任务、条件判断任务,能理解用户的深层需求。
典型痛点
- 大模型幻觉问题严重,编排流程容易出错,比如调用错误的工具、传错参数;
- 编排延迟高,复杂任务需要几十秒才能完成;
- 跨生态能力弱,无法打通封闭的应用生态,比如不能调用微信发消息、不能调用支付宝转账;
- 隐私风险依然存在,用户的偏好、任务数据还是要传到云侧处理。
这个阶段的单任务完成率大概是75%,用户满意度7分左右,已经能帮用户处理很多实际的复杂任务,但是还是不够智能。
第四阶段:自主进化时代(2025-2030)
问题背景
端侧大模型技术成熟,联邦学习、终身学习技术落地,用户对隐私的要求越来越高,希望AI助理能完全懂自己,不需要自己说就能主动帮自己处理事情,同时保证所有的敏感数据都不会泄露。
核心痛点
之前的大模型原生编排架构是云侧集中式的,隐私风险高,个性化能力有限,无法实现终身学习,容易出现灾难性遗忘。
解决方案
这个阶段的Harness是端云协同的分布式自主进化架构,核心是「端侧大模型+联邦学习+终身学习引擎」的组合:端侧负责敏感数据的处理、偏好存储、轻量任务编排,云侧负责能力聚合、联邦学习模型更新,整个系统可以在不泄露用户数据的前提下持续进化,越来越懂用户。代表产品有苹果的AI Personal Agent、安卓的Gemini Agent、开源的PersonalHarness项目。
架构设计
核心特点
- 权重配置:α=0.2,β=0.2,γ=0.3,δ=0.3\alpha=0.2, \beta=0.2, \gamma=0.3, \delta=0.3α=0.2,β=0.2,γ=0.3,δ=0.3,隐私和个性化成为最重要的考量因素;
- 能力范围:全生态打通,不管是系统应用、第三方APP、IoT设备、云服务,都可以统一调用;
- 任务处理:支持主动感知用户需求,不需要用户指令就能自主完成任务,比如你快过生日了,主动帮你订蛋糕、通知朋友;
- 隐私保护:敏感数据完全不出端,所有的个性化训练都是在端侧完成,云侧只聚合加密的梯度,不会拿到用户的原始数据。
典型预期能力
- 你出差刚下飞机,助理已经帮你打好了车,发送了你的到达时间给接机的同事,同步了酒店的入住码到你的锁屏;
- 你妈妈的生日快到了,助理已经帮你选好了她之前提过想要的护肤品,对比了京东、淘宝、拼多多的价格,选了最快的快递,你只要确认支付就可以;
- 你攒了一个月的报销单,助理已经自动从各个APP里导出了订单、生成了报销单、提交到了公司的系统,你只要等着报销到账就行。
这个阶段的单任务完成率预计会超过90%,用户满意度超过9分,真正实现「千人千面」的专属个人助理。
行业发展对比与趋势
发展阶段对比表
| 阶段 | 时间范围 | 代表产品 | 核心技术 | 架构 | 单任务完成率 | 用户满意度 |
|---|---|---|---|---|---|---|
| 规则驱动时代 | 1993-2010 | Newton助手、Clippy | 硬编码规则、有限状态机 | 集中式硬编码 | <30% | 3分 |
| API编排时代 | 2011-2020 | Siri、小爱同学 | 意图识别、API网关 | 云集中式 | ~55% | 5分 |
| 大模型原生时代 | 2021-2024 | GPTs、澎湃OS小爱 | 大模型、RAG、工具调用 | 云侧大模型+轻量端侧 | ~75% | 7分 |
| 自主进化时代 | 2025-2030 | 苹果AI Agent、PersonalHarness | 端侧大模型、联邦学习、终身学习 | 端云协同分布式 | >90% | >9分 |
未来发展趋势
- 系统级集成:未来的Harness会成为操作系统的核心模块,比如iOS、安卓、鸿蒙都会内置系统级的Harness,打通所有应用的能力,不需要第三方应用单独开放接口;
- 全场景覆盖:从手机、电脑到汽车、智能家居、可穿戴设备,所有的智能设备都会共享同一个Harness,用户的偏好、能力在所有设备上同步;
- 隐私优先:端侧计算会成为主流,90%以上的任务都会在端侧完成,敏感数据完全不出端,符合全球的隐私法规要求;
- 开放生态:会形成统一的Harness能力接入标准,开发者只需要适配一次,就可以在所有的个人助理上运行自己的能力;
- 脑机接口融合:远期来看,Harness会和脑机接口结合,用户不需要说话、打字,只要有想法,Harness就能帮你完成任务。
最佳实践Tips
对于想要做个人助理Harness开发的开发者,我们总结了10条最佳实践:
- 端侧优先原则:能在端侧处理的逻辑绝对不要传到云侧,最大程度保护用户隐私;
- 可解释可干预:所有的编排流程都要对用户透明,用户可以随时暂停、修改、取消任务,不要做黑盒操作;
- 权限最小化:每个能力只申请必要的权限,比如订机票的能力不要申请读取通讯录的权限;
- 偏好分层设计:偏好分为系统默认偏好、用户自定义偏好、临时偏好三个层级,优先级依次升高;
- 优雅降级:编排失败的时候要主动告诉用户,给出替代方案,不要默默失败或者甩锅给用户;
- 增量学习:用户的每次反馈都要增量更新偏好模型,不要重新训练整个模型,避免灾难性遗忘;
- 端到端加密:跨端同步的数据要做端到端加密,即使云服务被攻破,用户的数据也不会泄露;
- 能力审核机制:第三方接入的能力要做安全审核,防止恶意能力窃取用户数据;
- 离线可用:没有网络的时候也要能执行本地能力,比如设置闹钟、打开APP、查询本地日程;
- 人群适配:针对不同的用户群体做适配,比如老年人模式减少操作步骤、增加确认环节,年轻人模式提升自主性、减少打扰。
FAQ 常见问题
Q1:Harness Engineering和插件系统有什么区别?
A:插件系统只是Harness的能力抽象层的一个实现,Harness包含了插件系统,还有编排引擎、个性化适配、隐私计算、进化迭代等全链路的能力,目标是实现端到端的任务执行,而不是简单的功能扩展。
Q2:个人用户怎么搭建自己的专属Harness?
A:现在已经有很多开源的框架可以用,比如LangChain、LlamaIndex,你可以把自己常用的服务的API接进去,上传自己的偏好数据,就可以搭建自己的专属助理;也可以用GPTs自定义自己的助理,不需要写代码就能实现简单的功能;未来还可以用开源的PersonalHarness项目,一键部署自己的端侧Harness。
Q3:Harness会不会代替现有的APP?
A:不会,Harness是APP的调度层,APP还是负责实现具体的业务功能,比如订机票的功能还是携程的APP实现,Harness只是帮你自动调用携程的能力,不需要你手动打开APP操作。
Q4:Harness的隐私安全怎么保证?
A:现在的最佳实践是端侧加密存储用户数据,敏感数据不出端,需要云侧处理的用联邦学习、零知识证明等技术,不要传输原始数据,所有的权限都由用户控制,用户可以随时撤回权限、删除数据。
本章小结
个人助理型AI Agent的Harness Engineering过去30年的演变,本质上是从「人适应AI」到「AI适应人」的过程:最早的规则驱动时代,人要记住AI能处理什么指令,适应AI的能力;API编排时代,AI能听懂一部分人的指令,但是还是要人适应它的能力范围;大模型原生时代,AI能听懂大部分人的指令,能处理复杂任务,但是还是需要人纠正它的错误;未来的自主进化时代,AI会完全适应人的习惯,主动帮人处理事情,真正成为人的「数字分身」。
现在我们正处于大模型原生时代向自主进化时代过渡的关键节点,整个领域还有非常多的问题需要解决,不管是开发者还是普通用户,都有机会参与到这个领域的建设中,共同打造属于每个人的专属AI助理。
延伸阅读资源:
- OpenAI GPTs官方文档:https://platform.openai.com/docs/guides/gpts
- 开源PersonalHarness项目地址:https://github.com/personal-harness/core
- 端侧大模型技术白皮书:https://arxiv.org/abs/2401.02209
- 联邦学习在个人助理中的应用论文:https://arxiv.org/abs/2309.10762
(全文完,共计11237字)
更多推荐




所有评论(0)