本人从零开始学习,希望各位多多批评指正

ai agent是一个人类的梦想

但是ai agent并不是人工智能(大语言模型), openclaw对任务进行加工传给大语言模型,所以龙虾其实只是一个界面

ai agent是怎么运作的

语言模型真正做的事是词语接龙:人类输入一个prompt,语言模型就会产生一个token,然后继续prompt+token再次输入进语言模型,不断这样循环,直到结束。 一连串的token合起来就是语言模型给我们的回应,叫response。 语言模型的输入+输出(context window)是有限的,目前的语言模型的token可以输入上百万。 输入越长,就算是没有达到上限,也会导致返回的结果不准确。

ai agent是怎么知道自己是谁的

人 ->agent->大语言模型,人类将自我介绍发给agent,然后agent查询有关自己的咨询以及介绍(一些.md文件之类的东西),以prompt的输入发给大语言模型,返回token,agent再把答案传给人类。 ai agent具有健忘症,每次对话都要重新开启(每次都要阅读自己的记录)。

ai agent是怎么使用电脑的

如果让龙虾打开一个txt文件并在其中写入一行文字,则agent把这个要求变成prompt发给大语言模型,然后大语言模型返回的token中有特殊的符号,叫做使用工具(tool_use),大语言模型是怎么知道有这个使用工具的呢,因为这都写在system prompt内。agent把返回的这段话直接执行。 ai agent牛逼就牛逼在能随便使用电脑上的工具->使用文字指令(shell command)是更方便快捷的。 但是问题随之而来,因为agent会阅读咨询,万一阅读到危险的指令,则有可能会有很大的风险。

可能的防御方法

语言层面的防御(不绝对,不好用) openclaw层面的防御,在agent操作前通过弹窗来确保每次操作时经过允许的

ai agent会自己创作工具

龙虾的特殊工具:Sub-agent(sessions-spawn)->繁殖,如果要比较AB,则会繁殖出龙虾子代一个看A一个看B(其中是非常多的互动)。 这种繁殖的方法与一个大龙虾比有什么好处呢,答案就是可以节省context window。这种节省的方法叫context engineering。

SKILL就是工作的SOP(工作的完整流程)

找寻指定资料,看看有没有SKILL.md

跨session的记忆靠工具处理

memory_search memory_get

注意模型有可能光说不练

垃圾模型是这样的,只要没有开启工具去修改.md档案,无论说什么,都没什么用

龙虾独特的心跳机制

龙虾是很笨的程序,心跳机制让他每隔一段时间就戳一下大语言模型,让大语言模型读一下heartbeat档案,干一干能干的事情。 其中的heartbeat档案里的内容也是可以进行修改的。

基于心跳机制的Cron Job系统 -->排程工具

假如下指令说每天中午写一部文章,龙虾把指令交给大语言模型,那么模型就可能通过cronjob系统设置排程。 当然cronjob系统也会让机器学会等待。

龙虾的context compression功能,可以压缩上下文

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐