AI发展大致分为5个阶段

L1 聊天、L2 推理者、L3 智能体、L4 创新者、L5 组织者——目前我们正处于 L3 智能体阶段。2025 年被称为智能体(Agent)的元年,大模型的能力突飞猛进,通用人工智能(AGI)也成为热议的焦点。然而,在真实的业务场景与落地应用中,仍存在巨大的落差。大量创业者与企业仍处于初级探索阶段,身边的亲戚朋友大多还在使用豆包、DeepSeek、元宝等基础 C 端工具,更多只是将其视为一种新型搜索引擎。这与我们日常讨论的多智能体协作、工作流自动化、上下文工程等高阶 AI 应用仿佛处于两个世界。究其原因,主要有两点:其一,大模型本身的使用门槛较高;其二,提示词(Prompt)设计成为一大瓶颈——高质量提示词的撰写难度,将 95% 以上的用户挡在了高效 AI 应用的大门之外

从“ 一个AI x 招商绘图的需求 ” 开始

接下来。我们将从“ 一个AI x 招商绘图的需求 ” 开始。详细需求是“视觉理解与生成”。提示词为: 绘制一张关于:羽毛球的广告图片,要求有精彩的运动场景、以及特写羽毛球的镜头。 如果我们将提示词给到元宝、豆包,大概率就是下面这么个形态。如果满分是10分,你会打几分。

于是,我们切换一个思路:尝试给AI 更多需求的描述,比如风格、特写镜头、运动姿态、以及标题。发现效果确实是会好一些。如果满分是10分,你会打几分。 但是与真正目标还是差距很大、很大。为什么会这样呢? 第一:绘图本身是个美术设计专业,有一些专业元素以及描述技巧我们大部分人都不太擅长。 同时,想这么多描述的文字确实挺费脑子、费人力的。可能对于大家来说不是问题哈,但对于我来说确实是个挑战。 那就想:在AI 时代,这么专业的描述是不是可以交给强大的AI。大家都知道AI 很强,尤其擅长信息收集、文字处理。特别是DeepSeek R1开源后 带来了各家大语言模型在推理能力方面的进步。

于是,我们开始尝试对任务进行拆解:分为“输入、意图识别、AI 提示词按需调整、 最后再多加一道:再让AI 优化绘画提示词”。 举个例子:设计一个TME 中秋月饼礼盒,我们将风格、元素、背景、以及主题文字 这样一个比较清晰也相对简单的描述给到AI,让AI 根据输入优化绘画提示词。最终我们也可以看到AI的优化后的提示词确实够细也相对专业。

诉求:现在有一个需求做一个中秋月饼礼盒海报

经过设计对比,我们将同样的用户输入“就是上面小红色的一小段文字”,可以看到如果直接给到AI绘画效果、与给到智能体的效果对比。那最右侧的“引入智能体结果示例”看着与需求就是一个相对匹配的一个状态,可以看得到智能体优化提示词后的海报效果高出几个段位

拆解:刚刚精美的海报,它原来是这样生产出来的

那我们再来简单回顾一下:刚刚使用了AI 优化后的一个智能体关键环节输入、信息提取、海报元素提取、让AI再优化绘画提示词,最后将提示词给到绘画组件。其实

这就是一个生成海报的智能体,因为我担心一上来讲各种框架、各种技术概念,大家体验没有那么深刻。那有人就在想:是不是可以多测试一下,跑个分?

接着,

我们就连续将智能体生成“羽毛球的广告图片,要求有精彩的运动场景、以及特写羽毛球的镜头;连续生成4张”。如果满分10分,大家打几分。

为了测试稳定性,

我们也尝试让智能体生成出行的一个根据旅行目的地的一个精美图片。贵州、马来西亚、海南、日本。 如果满分10分,大家打几分

同样的旅行目的地,上面的色彩风格浓厚一些那我们也可以让智能体设计 “中国山水画” + “卡通风格”,一起来看看效果 ~

创建智能体:从最简单的最简单的“ Workflow ” 案例开始 

根据视频内容生成图片” 的智能体

大家这里就会开始有疑问前面说了这么多。那智能体要怎么创建呢,首先我们可以相关智能体框架进行设计,这里举coze工作流智能体为例。 首先:创建智能体、设计好工作流那工作流其实就像我们的US任务调度一样、一环扣一环,依赖上一层级的完成。那前面的海报设计也是工作流智能体。那这里我是提前设计好的。

Workflow 到 Agent:自主智能体实践​

除了工程流智能体外,还有自主智能体。这里我们来看一下两类智能体的一个对比。

  1. 工作流:一系列预定义、固定步骤的大语言模型调用流程,行为高度可预测,本质:​​ 人类主导流程控制( 充当“ 大脑 ” )
  2. 自主智能体:大模型自主决策执行步骤直至任务完成,核心特征:​​ ​​LLM 自主决策驱动流程执行

这里也抛一个发散性问题给到大家:就是“workflow智能体不等同于自主智能体,workflow 在未来是不是会被自主智能体替代?”

采用Agent 框架开发:那什么是 AI Agent 框架?

刚刚我们是采用Agent 框架开发了2个智能体:那什么是 AI Agent 框架?

Agent 通用技术框架”指的是为构建具有自主性、反应性和目标导向的智能代理而设计的一套通用模型或体系结构。它定义了 Agent 如何感知环境、处理信息、做出决策并执行行动的核心组件及其交互方式。不同的框架细节可能有差异,但核心组成部分和逻辑流程大致相似。以下是一个典型的 Agent 通用技术框架及其重要组成元素: 感知反馈、规划、工具使用、记忆

那有人就会问了,智能体跟记忆什么关系。​​ 记忆是 Agent 具有智能 和 连续性 的关键。没有记忆Agent 每次只能对单一刺激做出即时反应,无法进行复杂推理、基于历史做决策、保持上下文一致性、进行学习和持续改进。 最右侧是目前市面的一些智能体框架,比如扣子、腾讯元器。

智能体开发框架及流程

在最左侧我们要有大模型、也要有自己的知识库,第二,我们可以基于智能体开发平台去构建属于自己业务的一个智能体那最核心最关键的部分是什么呢,就是基于业务去分析我们到底适合是固定工作流,还是可接受发散性的一些预期结果,同时也要结合业务定制一些风险控制

  1. 那比如在医疗行业,目前大部分就是固定工作流,不允许出错重大偏差;
  2. 但在AI客服、销售文案创意 方面就可以适度发散一些,那可以采用自主智能体

最后就是发布上线、调试、优化、再发布这个一个循环。

自主智能体大脑 planner & executor 模型选择

那大模型如何选择,一个参考就是benchmark评分。

但我个人觉得还需要关注 另外一个指标就是大模型的响应速度,尤其在ToC的Agent 应用。最后:需要关注模型的输入、输出Token有效数。

随着Agent 框架持续涌现,单/多智能体也在百花齐放

随着Agent 框架持续涌现,单智能体与多智能体协同这两类框架架构也呈现协同发展的态势

那目前的智能体应用主要在哪些方面呢:这里有一个坐标轴:横轴是行业、竖轴是需要关注的技术领域。那这里就有比较典型的编程、客服、招聘、文案等等智能体的应用。 最右侧是近日,CB Insights发布《Top 20 AI Agent》榜单,是根据年收入规模评选出全球营收表现最突出的AI Agent初创企业,可以看到CURSOR排在第一。

AI 编程:“ 氛围编程”、“ 结对编程” 共存

AI 编程:像Qwen3-Coder​​、以及腾讯的CodeBuddy,当然还有CURSOR。

对于代码片段、小项目来说AI编程问题不大;但当小项目到一个复杂功能的小项目,以及中型项目、大型项目来说对于AI编程还是不太行的

AI 编程有价值意义:

  1. 首先对于 产品设计 非开发可以通过AI编程生成初步创意;
  2. 对于技术人员、架构设计可以与AI 进行有效的“结对”编程

BI 平台演进 - 全面进入智能化

随着AI的普及,数据BI平台的演进也在快速演进。

大致可以分为:业务仪表盘、自助数据分析、智能洞察决策 3个阶段。 那我们现在正处于自助数据分析,像星盘、datatalk、startalk等均属于敏捷型数据分析平台可支持下钻分析等常规业务取数。 那在AI 时代,BI系统会往智能BI,它可以洞察数据,指导决务决策,也可以做一些归因分析。那对于我们数据同学来说,我们的某些工作方向会有一些变化,从之前的跑数、取数,到洞察业务;只不过之前洞察业务是人工经验分析,在AI下我们可以通过一些AI工具进行提效。

AI 辅助业务分析: 业务各活跃分层异常指标

现在各大厂内部也有一些数据方面的AI 工具,比如数据类的ChatBI。

  1. 首先我们需要定义好业务口径、确认数据质量
  2. 然后我们可以向其输入一个数据让其分析结论

比如这里是最近跑 “某业务各种口径分层分析”,将数据传给AI 让其帮助业务分析哪些指标是下降的、哪些是增长的。从分析的结果来看:确实是发现了业务的实际情况。

Working with AI: 与人工智能协同共进

在7月底微软发了一便论文:working with ai,中文的意思就是:与人工智能协同共进:生成型人工智能对职业影响的度量,研究发现:

  1. 人们寻求人工智能协助的最常见工作活动包括收集信息和写作
  2. 而人工智能自身执行的最常见活动则是提供信息与协助、写作、教学以及提供建议

生成式AI作为通用技术快速普及(40%美国人使用),其普及速度超过了早期个人计算机和互联网的扩散 结论:AI主要影响知识与沟通类工作,最常见为提供信息、教学、建议.

在研究中,论文提到两个方向:

  1. AI 执行能力比较靠前的方向,比如 :回应客户问题或咨询、向公众提供信息 / 协助、向客户 / 顾客提供信息;
  2. 用户目标诉求比较靠前的方向,比如:从各类来源收集信息、获取有关商品或服务的信息、回应客户问题或咨询。

右侧这个图是国内AI 排行,仅供参考.

当AI热潮袭来:如何智慧地使用AI ?

最后一个话题就是:当AI热潮袭来:如何智慧地使用AI ?

       有一部电影叫《她》,里面的主人公与AI 恋爱,同时AI 又和多人同时恋爱的一个场景。这里在表述一个点就是AI 是迎合式回应,甚至在未来有一些人可能像电影一样与AI 恋爱。 那这里如果你是一位乐观的人,AI 则会迎合往乐观的方向思考。如果你是偏悲观的人,AI 则会迎合往消极的方向思考,甚至出现AI 教唆14岁男孩自杀的真实的案例。

一方面是AI有偏好式回应,另一方面AI 有幻觉。比如:花木兰替父从军时 手持长枪描准敌人,可以看到花木兰拿着的枪不符合那个时代的。实际需要的是 一把长长的头尖尖的古代的武器。

那这里提到几个tips:

  1. 保护自己、明确AI 是生产工具,与AI 共事时 我们需要梳理清晰;
  2. 最后使用任何模型时,尤其是在需要高可靠性的领域(医疗、法律、金融、新闻),都​​必须​​采取防范措施:
  3. 启用搜索增强、要求引用来源、进行人工核查、避免过度依赖单一模型输出。

文章最后一起与大家探讨:

  1. 工作流方式是否会被取代?或者当大模型足够强,还会有多少的工作流的应用?
  2. 智能体有门槛么,有技术壁垒么?
  3. 未来 ToC 最大的智能体在哪些场景? 手机厂商?一个智能终端设备,可呼起各应用智能体

欢迎大佬们 评论区交流留言 ~

Logo

一座年轻的奋斗人之城,一个温馨的开发者之家。在这里,代码改变人生,开发创造未来!

更多推荐