个人助理型 AI Agent Harness Engineering 的产品形态演变


引言

痛点引入

你有没有过这样的经历:对着手机里的语音助手说「下周我要去杭州参加云栖大会,帮我安排好行程」,得到的回复却是「我帮你搜了杭州的天气,未来一周晴好」,完全get不到你要订机票、订酒店、同步日历、约当地朋友吃饭的深层需求;你攒了半个月的报销单,要一个个打开携程、美团、滴滴的订单,复制金额、粘贴到报销系统、上传凭证,折腾半小时才能搞定,而你的AI助理只能在旁边看着帮不上忙;你换了新手机,之前的语音助手完全记不住你喜欢坐靠窗的经济舱、住离会场步行10分钟以内的四星酒店、喝三分糖少冰的奶茶,所有偏好要重新设置一遍。

这些痛点的核心,从来都不是AI的理解能力不够——GPT-4o已经能听懂人类99%的自然语言需求——而是AI和用户所处的数字化环境之间,缺少一个能够打通能力、适配偏好、编排流程、保护隐私的中间层,这个中间层就是我们今天要聊的核心:个人助理型AI Agent的Harness Engineering(线束工程/能力挂载工程)。

核心问题

本文将围绕以下核心问题展开讲解:

  1. 什么是个人助理型AI Agent的Harness Engineering?它和普通的插件系统、低代码平台有什么本质区别?
  2. 从1990年代最早的PDA助手到今天的大模型原生AI助理,Harness Engineering的产品形态经历了哪几个阶段的演变?每个阶段解决了什么问题、还有哪些痛点?
  3. 未来5-10年,个人助理型Harness Engineering会向什么方向发展?普通开发者和用户怎么参与到这个领域的建设中?

文章脉络

本文首先会明确Harness Engineering的核心概念、边界与核心组成,然后按照时间线梳理四个发展阶段的技术特点、代表产品、架构设计,结合数学模型、算法流程、代码示例讲解核心实现逻辑,最后分析行业趋势和最佳实践,给开发者和用户提供可落地的指导。


基础概念与核心定义

核心概念

什么是个人助理型AI Agent?

个人助理型AI Agent是面向C端用户、以服务个人全场景数字化需求为目标的自主智能体,它具备三个核心特征:

  • 专属身份:和单一用户绑定,持续学习用户的偏好、习惯、生活/工作节奏;
  • 环境感知:能感知用户所处的设备、位置、网络、日程等上下文信息;
  • 自主执行:不需要用户逐步指令,就能自主完成跨应用、跨设备、跨服务的复杂任务。
什么是Harness Engineering?

Harness Engineering是AI Agent和用户数字化环境之间的「交互总线工程体系」,负责将Agent的决策转化为对用户环境中各类能力的调用,同时将环境的反馈回传给Agent,核心目标是让AI Agent的能力不受限于底层应用、服务、设备的生态壁垒,用最低的成本实现复杂任务的端到端执行

和普通的插件系统不同,Harness Engineering不是简单的能力挂载工具,而是包含「能力抽象、流程编排、个性化适配、隐私计算、迭代进化」的全链路工程体系。

边界与外延

Harness Engineering的核心边界非常清晰:

  • ❌ 它不是大模型本身:不负责核心推理、逻辑判断,只负责决策的落地执行;
  • ❌ 它不是应用/服务:不实现具体的业务功能(比如订机票、发消息),只做不同应用能力的串联;
  • ❌ 它不是操作系统:不管理硬件资源,只跑在用户态做上层能力的调度。

它的外延可以延伸到个人全场景:从手机、电脑的应用调度,到智能家居、汽车的控制,再到个人数字资产的管理,所有需要AI和外部环境交互的场景,都需要Harness Engineering的支撑。

核心要素组成

个人助理型Harness Engineering由四大核心模块组成:

模块名称 核心功能 设计优先级
能力抽象层 把不同来源的能力(本地APP、云SaaS、硬件设备)抽象为统一的接口,屏蔽底层生态差异 兼容性 > 性能
编排引擎层 根据用户任务、上下文、偏好生成最优的能力调用流程,处理异常、重试、回滚 准确性 > 效率
个性化适配层 加密存储用户的全量偏好数据,持续学习用户的反馈,优化编排策略 隐私性 > 准确性
隐私计算层 通过端侧计算、联邦学习、零知识证明等技术,保证用户敏感数据不出端 安全性 > 功能性

概念关系梳理

核心属性对比

我们把Harness Engineering和常见的相似产品做核心属性对比:

产品类型 核心目标 面向用户 个性化能力 隐私保护能力 编排自主性 生态开放性
Harness Engineering 实现AI Agent的全场景能力调度 AI Agent + 个人用户 高(单用户专属) 极高(敏感数据不出端) 高(自主生成编排流程) 高(支持任意能力接入)
普通插件系统 扩展单一应用的功能 应用开发者 低(无用户偏好感知) 低(数据上传到应用服务端) 低(固定流程调用) 中(仅支持对应应用的插件)
低代码平台 降低应用开发门槛 企业开发者 低(面向组织流程) 中(符合企业合规要求) 低(人工定义流程) 中(仅支持平台内置组件)
操作系统 管理硬件和软件资源 所有用户 低(系统级通用配置) 中(依赖系统隐私策略) 高(支持任意应用安装)
实体关系ER图

has

submits

generates

calls

produces

corresponds_to

updates

constrains

USER

PREFERENCE

TASK

ORCHESTRATION_FLOW

CAPABILITY

EXECUTION_LOG

USER_FEEDBACK

核心数学模型

Harness Engineering的核心决策逻辑是在给定任务、偏好、可用能力集的约束下,找到效用最大的编排路径,我们用以下数学公式表示:
U(S)=α×Acc(S)+β×Time(S)+γ×Privacy(S)+δ×Personal(S)U(S) = \alpha \times Acc(S) + \beta \times Time(S) + \gamma \times Privacy(S) + \delta \times Personal(S)U(S)=α×Acc(S)+β×Time(S)+γ×Privacy(S)+δ×Personal(S)
其中:

  • U(S)U(S)U(S) 是编排路径SSS的总效用,取值范围[0,1];
  • Acc(S)Acc(S)Acc(S) 是任务完成准确率,取值范围[0,1],表示任务完成符合用户预期的概率;
  • Time(S)Time(S)Time(S) 是时间效率得分,取值范围[0,1],完成时间越短得分越高;
  • Privacy(S)Privacy(S)Privacy(S) 是隐私保护得分,取值范围[0,1],敏感数据出端越少得分越高;
  • Personal(S)Personal(S)Personal(S) 是偏好匹配得分,取值范围[0,1],越符合用户偏好得分越高;
  • α、β、γ、δ\alpha、\beta、\gamma、\deltaαβγδ 是四个维度的权重,不同发展阶段的权重差异很大,我们后面会详细讲解。

产品形态演变的四个阶段

我们把个人助理型Harness Engineering的发展分为四个阶段,每个阶段的技术、产品、痛点都有非常清晰的特征:

第一阶段:规则驱动时代(1993-2010)

问题背景

这个阶段个人数字化设备刚刚普及,PDA、功能机是主流,用户的数字化需求非常简单,主要是通讯录、日历、备忘录的管理,没有第三方应用生态,所有能力都是系统内置的。

核心痛点

用户需要逐点操作才能完成任务,没有自动化的能力,比如你要加一个日程,需要手动打开日历APP、输入时间、输入标题、保存,没有办法用自然语言一次性完成。

解决方案

这个阶段的Harness是硬编码的有限状态机,所有的逻辑都是开发者提前写死的,只能匹配预设的规则。比如Apple 1993年推出的Newton PDA的助理,诺基亚2007年推出的语音小助手,微软的Office助手Clippy,都是这个阶段的代表产品。

架构设计

架构非常简单,就是集中式的硬编码架构,逻辑和能力完全耦合:

用户输入(触控/语音)

规则匹配引擎

匹配预设规则?

调用系统内置能力

返回无法识别提示

结果返回给用户

核心特点
  • 权重配置:α=0.8,β=0.1,γ=0.05,δ=0.05\alpha=0.8, \beta=0.1, \gamma=0.05, \delta=0.05α=0.8,β=0.1,γ=0.05,δ=0.05,几乎只关注任务的准确率,其他维度完全不重要;
  • 能力范围:仅支持系统内置的10-20个能力,无法扩展;
  • 任务处理:仅支持单步固定指令,无法处理复杂的多步任务、条件判断任务。
典型痛点
  • 只能处理预设指令,稍微超出规则范围就无法响应;
  • 没有任何个性化能力,所有用户的逻辑完全一致;
  • 扩展性极差,新增能力需要修改整个系统的代码。

这个阶段的单任务完成率不到30%,用户满意度只有3分(10分制),本质上只是一个「快捷指令集合」,算不上真正的Harness。


第二阶段:API编排时代(2011-2020)

问题背景

智能手机普及,移动互联网爆发,第三方应用生态快速成熟,用户的数字化需求变得复杂,需要跨应用完成任务,比如用微信发消息、用滴滴打车、用携程订机票,用户希望用自然语言就能完成这些操作,不需要逐点打开APP。

核心痛点

不同应用的接口完全不统一,开发者没办法用统一的逻辑调用不同APP的能力,意图识别准确率低,无法理解用户的复杂需求。

解决方案

这个阶段的Harness是云侧集中式的API编排架构,核心是「意图识别+API网关」的组合:首先用语音识别、自然语言理解技术识别用户的意图,然后通过API网关调用第三方服务的开放接口,完成任务。代表产品有Apple Siri、小米小爱同学、Google Assistant、亚马逊Alexa。

架构设计

用户语音输入

云侧语音识别

意图识别引擎(CRF/BiLSTM)

API网关: 匹配对应第三方服务接口

调用第三方服务API

结果返回给用户

核心实现代码示例

这个阶段的核心是意图识别,我们用Python实现一个简单的意图分类器:

import jieba
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline

# 训练数据:意图和对应的话术
train_data = [
    ("订明天北京到上海的机票", "book_flight"),
    ("帮我查下周一去广州的航班", "book_flight"),
    ("订陆家嘴附近的酒店", "book_hotel"),
    ("下周五杭州有没有合适的住宿", "book_hotel"),
    ("帮我加一个明天下午3点的会议日程", "add_calendar"),
    ("下周三的约会记到日历里", "add_calendar"),
    ("今天北京天气怎么样", "query_weather"),
    ("明天上海会不会下雨", "query_weather")
]

# 数据预处理
texts = [item[0] for item in train_data]
labels = [item[1] for item in train_data]

# 构建意图分类Pipeline
intent_classifier = Pipeline([
    ('tfidf', TfidfVectorizer(tokenizer=jieba.lcut)),
    ('classifier', MultinomialNB())
])

# 训练模型
intent_classifier.fit(texts, labels)

# 意图识别接口
def recognize_intent(text: str) -> str:
    return intent_classifier.predict([text])[0]

# 测试
if __name__ == "__main__":
    test_text = "帮我订下周二去深圳的机票"
    intent = recognize_intent(test_text)
    print(f"识别到的意图:{intent}")
    # 输出:识别到的意图:book_flight
核心特点
  • 权重配置:α=0.6,β=0.2,γ=0.1,δ=0.1\alpha=0.6, \beta=0.2, \gamma=0.1, \delta=0.1α=0.6,β=0.2,γ=0.1,δ=0.1,开始关注时间效率和少量的个性化;
  • 能力范围:支持第三方开发者上传技能,最多可以扩展到几千个能力;
  • 任务处理:支持简单的多步任务,比如订机票之后可以帮你加到日历里。
典型痛点
  • 意图识别准确率低,只能识别预设的几百个意图,超出范围就无法处理;
  • 跨意图编排能力弱,无法处理需要多个意图串联的复杂任务,比如「订机票+通知秘书接机+订酒店」;
  • 隐私风险高,所有的用户语音、数据都要传到云侧处理,容易泄露;
  • 个性化能力弱,只能记住少量的用户配置,无法学习用户的深层偏好。

这个阶段的单任务完成率大概是55%,用户满意度5分左右,用户的感知就是「说十句话有五句能听懂,但是只能做简单的事」。


第三阶段:大模型原生编排时代(2021-2024)

问题背景

大语言模型爆发,AI的自然语言理解能力、推理能力实现了质的飞跃,用户希望AI能处理更复杂的端到端任务,比如「帮我把上个月的所有出差订单整理成报销单,提交到公司的报销系统」,而不仅仅是单步的指令响应。

核心痛点

之前的API编排架构的意图识别是固定的,无法适配大模型的灵活推理能力,工具调用幻觉问题严重,编排的流程经常出错,无法匹配用户的个性化偏好。

解决方案

这个阶段的Harness是大模型原生的编排架构,核心是「大模型推理+RAG偏好库+能力适配层」的组合:用大模型做任务理解、编排路径生成,用RAG技术存储和召回用户的偏好,用统一的适配层屏蔽不同服务的接口差异。代表产品有ChatGPT GPTs、AutoGPT个人版、Claude Projects、小米澎湃OS的小爱助理。

架构设计

用户输入/多模态感知

大模型任务理解

RAG偏好库召回用户习惯

编排引擎生成最优调用流程

能力适配层调用对应服务

结果校验: 是否符合预期?

返回结果给用户

重新编排/请求用户干预

用户反馈更新偏好库

核心算法流程图
渲染错误: Mermaid 渲染失败: Parse error on line 5: ... D --> E[计算每个路径的效用值U(S)] E --> F[选择效 -----------------------^ Expecting 'SQE', 'DOUBLECIRCLEEND', 'PE', '-)', 'STADIUMEND', 'SUBROUTINEEND', 'PIPE', 'CYLINDEREND', 'DIAMOND_STOP', 'TAGEND', 'TRAPEND', 'INVTRAPEND', 'UNICODE_TEXT', 'TEXT', 'TAGSTART', got 'PS'
核心实现代码示例

我们用LangChain实现一个简单的大模型原生Harness编排引擎:

from langchain.agents import AgentExecutor, create_openai_tools_agent
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.tools import tool
import json
from typing import List, Dict

# 端侧加密存储的用户偏好,敏感数据不出端
USER_PREFERENCES = {
    "user_id": "u12345",
    "flight_preference": "economy class, window seat, avoid red-eye flights",
    "hotel_preference": "4-star, within 1km of destination, free wifi, no smoking room",
    "max_confirmation_steps": 2,
    "privacy_level": "high"
}

# 自定义工具:搜索机票
@tool
def search_flights(departure: str, destination: str, date: str) -> List[Dict]:
    """搜索符合条件的机票,参数:出发地 departure,目的地 destination,日期 date(格式YYYY-MM-DD)"""
    # 实际调用携程/飞常准API
    return [
        {"flight_no": "CA1234", "departure_time": "08:00", "arrival_time": "10:30", "price": 890, "seat_type": "economy", "window_available": True},
        {"flight_no": "MU5678", "departure_time": "14:00", "arrival_time": "16:40", "price": 750, "seat_type": "economy", "window_available": False}
    ]

# 自定义工具:搜索酒店
@tool
def search_hotels(location: str, checkin_date: str, checkout_date: str) -> List[Dict]:
    """搜索符合条件的酒店,参数:位置 location,入住日期 checkin_date,退房日期 checkout_date"""
    # 实际调用美团/携程API
    return [
        {"name": "杭州云栖小镇国际酒店", "distance": "0.5km", "star": 4, "price": 680, "free_wifi": True},
        {"name": "杭州滨江希尔顿", "distance": "1.2km", "star": 5, "price": 1280, "free_wifi": True}
    ]

# 自定义工具:添加日历行程
@tool
def add_calendar_event(title: str, start_time: str, end_time: str, location: str) -> str:
    """添加日程到用户本地日历,参数:标题 title,开始时间 start_time,结束时间 end_time,位置 location"""
    # 调用端侧系统API,不需要云侧参与
    return f"已添加日程:{title},时间:{start_time}{end_time},位置:{location}"

# Harness核心实现
class PersonalHarness:
    def __init__(self, user_preferences: Dict):
        self.user_preferences = user_preferences
        self.llm = ChatOpenAI(model="gpt-4o", temperature=0)
        self.tools = [search_flights, search_hotels, add_calendar_event]
        
        # 注入用户偏好到系统提示词
        prompt = ChatPromptTemplate.from_messages([
            ("system", f"""你是用户的专属个人助理,所有操作必须严格遵循用户偏好:
            {json.dumps(user_preferences, ensure_ascii=False)}
            1. 所有选择优先匹配用户偏好,不符合的选项直接过滤;
            2. 最多只需要用户确认{user_preferences['max_confirmation_steps']}次,尽可能自主完成任务;
            3. 敏感操作(比如支付)必须经过用户确认;
            4. 每一步操作都要向用户解释原因。
            """),
            ("user", "{input}"),
            MessagesPlaceholder(variable_name="agent_scratchpad"),
        ])
        
        self.agent = create_openai_tools_agent(self.llm, self.tools, prompt)
        self.agent_executor = AgentExecutor(agent=self.agent, tools=self.tools, verbose=True)
    
    def run_task(self, task: str) -> str:
        return self.agent_executor.invoke({"input": task})["output"]

# 测试
if __name__ == "__main__":
    harness = PersonalHarness(USER_PREFERENCES)
    result = harness.run_task("下周一会我要去杭州云栖小镇参加云栖大会,帮我安排行程")
    print(result)

运行之后的输出大概是:

已为你安排下周一云栖大会的行程:
1. 航班:CA1234,08:00北京起飞10:30到达杭州,经济舱靠窗座位,价格890元,符合你不要红眼航班、靠窗的偏好;
2. 酒店:杭州云栖小镇国际酒店,步行到会场0.5km,四星,680元/晚,有免费WiFi,符合你的酒店偏好;
3. 已将行程添加到你的本地日历。
是否需要为你预订机票和酒店?
核心特点
  • 权重配置:α=0.4,β=0.2,γ=0.2,δ=0.2\alpha=0.4, \beta=0.2, \gamma=0.2, \delta=0.2α=0.4,β=0.2,γ=0.2,δ=0.2,隐私和个性化的权重大幅提升;
  • 能力范围:支持任意第三方能力接入,生态完全开放;
  • 任务处理:支持复杂的多步任务、条件判断任务,能理解用户的深层需求。
典型痛点
  • 大模型幻觉问题严重,编排流程容易出错,比如调用错误的工具、传错参数;
  • 编排延迟高,复杂任务需要几十秒才能完成;
  • 跨生态能力弱,无法打通封闭的应用生态,比如不能调用微信发消息、不能调用支付宝转账;
  • 隐私风险依然存在,用户的偏好、任务数据还是要传到云侧处理。

这个阶段的单任务完成率大概是75%,用户满意度7分左右,已经能帮用户处理很多实际的复杂任务,但是还是不够智能。


第四阶段:自主进化时代(2025-2030)

问题背景

端侧大模型技术成熟,联邦学习、终身学习技术落地,用户对隐私的要求越来越高,希望AI助理能完全懂自己,不需要自己说就能主动帮自己处理事情,同时保证所有的敏感数据都不会泄露。

核心痛点

之前的大模型原生编排架构是云侧集中式的,隐私风险高,个性化能力有限,无法实现终身学习,容易出现灾难性遗忘。

解决方案

这个阶段的Harness是端云协同的分布式自主进化架构,核心是「端侧大模型+联邦学习+终身学习引擎」的组合:端侧负责敏感数据的处理、偏好存储、轻量任务编排,云侧负责能力聚合、联邦学习模型更新,整个系统可以在不泄露用户数据的前提下持续进化,越来越懂用户。代表产品有苹果的AI Personal Agent、安卓的Gemini Agent、开源的PersonalHarness项目。

架构设计
渲染错误: Mermaid 渲染失败: Lexical error on line 2. Unrecognized text. ...t TD subgraph 端侧(用户设备) A[多模态 ----------------------^
核心特点
  • 权重配置:α=0.2,β=0.2,γ=0.3,δ=0.3\alpha=0.2, \beta=0.2, \gamma=0.3, \delta=0.3α=0.2,β=0.2,γ=0.3,δ=0.3,隐私和个性化成为最重要的考量因素;
  • 能力范围:全生态打通,不管是系统应用、第三方APP、IoT设备、云服务,都可以统一调用;
  • 任务处理:支持主动感知用户需求,不需要用户指令就能自主完成任务,比如你快过生日了,主动帮你订蛋糕、通知朋友;
  • 隐私保护:敏感数据完全不出端,所有的个性化训练都是在端侧完成,云侧只聚合加密的梯度,不会拿到用户的原始数据。
典型预期能力
  • 你出差刚下飞机,助理已经帮你打好了车,发送了你的到达时间给接机的同事,同步了酒店的入住码到你的锁屏;
  • 你妈妈的生日快到了,助理已经帮你选好了她之前提过想要的护肤品,对比了京东、淘宝、拼多多的价格,选了最快的快递,你只要确认支付就可以;
  • 你攒了一个月的报销单,助理已经自动从各个APP里导出了订单、生成了报销单、提交到了公司的系统,你只要等着报销到账就行。

这个阶段的单任务完成率预计会超过90%,用户满意度超过9分,真正实现「千人千面」的专属个人助理。


行业发展对比与趋势

发展阶段对比表

阶段 时间范围 代表产品 核心技术 架构 单任务完成率 用户满意度
规则驱动时代 1993-2010 Newton助手、Clippy 硬编码规则、有限状态机 集中式硬编码 <30% 3分
API编排时代 2011-2020 Siri、小爱同学 意图识别、API网关 云集中式 ~55% 5分
大模型原生时代 2021-2024 GPTs、澎湃OS小爱 大模型、RAG、工具调用 云侧大模型+轻量端侧 ~75% 7分
自主进化时代 2025-2030 苹果AI Agent、PersonalHarness 端侧大模型、联邦学习、终身学习 端云协同分布式 >90% >9分

未来发展趋势

  1. 系统级集成:未来的Harness会成为操作系统的核心模块,比如iOS、安卓、鸿蒙都会内置系统级的Harness,打通所有应用的能力,不需要第三方应用单独开放接口;
  2. 全场景覆盖:从手机、电脑到汽车、智能家居、可穿戴设备,所有的智能设备都会共享同一个Harness,用户的偏好、能力在所有设备上同步;
  3. 隐私优先:端侧计算会成为主流,90%以上的任务都会在端侧完成,敏感数据完全不出端,符合全球的隐私法规要求;
  4. 开放生态:会形成统一的Harness能力接入标准,开发者只需要适配一次,就可以在所有的个人助理上运行自己的能力;
  5. 脑机接口融合:远期来看,Harness会和脑机接口结合,用户不需要说话、打字,只要有想法,Harness就能帮你完成任务。

最佳实践Tips

对于想要做个人助理Harness开发的开发者,我们总结了10条最佳实践:

  1. 端侧优先原则:能在端侧处理的逻辑绝对不要传到云侧,最大程度保护用户隐私;
  2. 可解释可干预:所有的编排流程都要对用户透明,用户可以随时暂停、修改、取消任务,不要做黑盒操作;
  3. 权限最小化:每个能力只申请必要的权限,比如订机票的能力不要申请读取通讯录的权限;
  4. 偏好分层设计:偏好分为系统默认偏好、用户自定义偏好、临时偏好三个层级,优先级依次升高;
  5. 优雅降级:编排失败的时候要主动告诉用户,给出替代方案,不要默默失败或者甩锅给用户;
  6. 增量学习:用户的每次反馈都要增量更新偏好模型,不要重新训练整个模型,避免灾难性遗忘;
  7. 端到端加密:跨端同步的数据要做端到端加密,即使云服务被攻破,用户的数据也不会泄露;
  8. 能力审核机制:第三方接入的能力要做安全审核,防止恶意能力窃取用户数据;
  9. 离线可用:没有网络的时候也要能执行本地能力,比如设置闹钟、打开APP、查询本地日程;
  10. 人群适配:针对不同的用户群体做适配,比如老年人模式减少操作步骤、增加确认环节,年轻人模式提升自主性、减少打扰。

FAQ 常见问题

Q1:Harness Engineering和插件系统有什么区别?

A:插件系统只是Harness的能力抽象层的一个实现,Harness包含了插件系统,还有编排引擎、个性化适配、隐私计算、进化迭代等全链路的能力,目标是实现端到端的任务执行,而不是简单的功能扩展。

Q2:个人用户怎么搭建自己的专属Harness?

A:现在已经有很多开源的框架可以用,比如LangChain、LlamaIndex,你可以把自己常用的服务的API接进去,上传自己的偏好数据,就可以搭建自己的专属助理;也可以用GPTs自定义自己的助理,不需要写代码就能实现简单的功能;未来还可以用开源的PersonalHarness项目,一键部署自己的端侧Harness。

Q3:Harness会不会代替现有的APP?

A:不会,Harness是APP的调度层,APP还是负责实现具体的业务功能,比如订机票的功能还是携程的APP实现,Harness只是帮你自动调用携程的能力,不需要你手动打开APP操作。

Q4:Harness的隐私安全怎么保证?

A:现在的最佳实践是端侧加密存储用户数据,敏感数据不出端,需要云侧处理的用联邦学习、零知识证明等技术,不要传输原始数据,所有的权限都由用户控制,用户可以随时撤回权限、删除数据。


本章小结

个人助理型AI Agent的Harness Engineering过去30年的演变,本质上是从「人适应AI」到「AI适应人」的过程:最早的规则驱动时代,人要记住AI能处理什么指令,适应AI的能力;API编排时代,AI能听懂一部分人的指令,但是还是要人适应它的能力范围;大模型原生时代,AI能听懂大部分人的指令,能处理复杂任务,但是还是需要人纠正它的错误;未来的自主进化时代,AI会完全适应人的习惯,主动帮人处理事情,真正成为人的「数字分身」。

现在我们正处于大模型原生时代向自主进化时代过渡的关键节点,整个领域还有非常多的问题需要解决,不管是开发者还是普通用户,都有机会参与到这个领域的建设中,共同打造属于每个人的专属AI助理。

延伸阅读资源

  1. OpenAI GPTs官方文档:https://platform.openai.com/docs/guides/gpts
  2. 开源PersonalHarness项目地址:https://github.com/personal-harness/core
  3. 端侧大模型技术白皮书:https://arxiv.org/abs/2401.02209
  4. 联邦学习在个人助理中的应用论文:https://arxiv.org/abs/2309.10762

(全文完,共计11237字)

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐