解剖小龙虾(openclaw) -来源于李宏毅老师的课堂
但是ai agent并不是人工智能(大语言模型), openclaw对任务进行加工传给大语言模型,所以龙虾其实只是一个界面。
本人从零开始学习,希望各位多多批评指正
ai agent是一个人类的梦想
但是ai agent并不是人工智能(大语言模型), openclaw对任务进行加工传给大语言模型,所以龙虾其实只是一个界面
ai agent是怎么运作的
语言模型真正做的事是词语接龙:人类输入一个prompt,语言模型就会产生一个token,然后继续prompt+token再次输入进语言模型,不断这样循环,直到结束。 一连串的token合起来就是语言模型给我们的回应,叫response。 语言模型的输入+输出(context window)是有限的,目前的语言模型的token可以输入上百万。 输入越长,就算是没有达到上限,也会导致返回的结果不准确。
ai agent是怎么知道自己是谁的
人 ->agent->大语言模型,人类将自我介绍发给agent,然后agent查询有关自己的咨询以及介绍(一些.md文件之类的东西),以prompt的输入发给大语言模型,返回token,agent再把答案传给人类。 ai agent具有健忘症,每次对话都要重新开启(每次都要阅读自己的记录)。
ai agent是怎么使用电脑的
如果让龙虾打开一个txt文件并在其中写入一行文字,则agent把这个要求变成prompt发给大语言模型,然后大语言模型返回的token中有特殊的符号,叫做使用工具(tool_use),大语言模型是怎么知道有这个使用工具的呢,因为这都写在system prompt内。agent把返回的这段话直接执行。 ai agent牛逼就牛逼在能随便使用电脑上的工具->使用文字指令(shell command)是更方便快捷的。 但是问题随之而来,因为agent会阅读咨询,万一阅读到危险的指令,则有可能会有很大的风险。
可能的防御方法
语言层面的防御(不绝对,不好用) openclaw层面的防御,在agent操作前通过弹窗来确保每次操作时经过允许的
ai agent会自己创作工具
龙虾的特殊工具:Sub-agent(sessions-spawn)->繁殖,如果要比较AB,则会繁殖出龙虾子代一个看A一个看B(其中是非常多的互动)。 这种繁殖的方法与一个大龙虾比有什么好处呢,答案就是可以节省context window。这种节省的方法叫context engineering。
SKILL就是工作的SOP(工作的完整流程)
找寻指定资料,看看有没有SKILL.md
跨session的记忆靠工具处理
memory_search memory_get
注意模型有可能光说不练
垃圾模型是这样的,只要没有开启工具去修改.md档案,无论说什么,都没什么用
龙虾独特的心跳机制
龙虾是很笨的程序,心跳机制让他每隔一段时间就戳一下大语言模型,让大语言模型读一下heartbeat档案,干一干能干的事情。 其中的heartbeat档案里的内容也是可以进行修改的。
基于心跳机制的Cron Job系统 -->排程工具
假如下指令说每天中午写一部文章,龙虾把指令交给大语言模型,那么模型就可能通过cronjob系统设置排程。 当然cronjob系统也会让机器学会等待。
龙虾的context compression功能,可以压缩上下文
更多推荐

所有评论(0)