
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了为OpenClaw增加语音识别功能的实现过程。作者通过部署FunASR语音识别服务,将飞书接收的ogg音频转换为wav格式后发送给FunASR进行识别。详细记录了环境搭建步骤,包括创建conda环境、安装依赖库、启动FunASR服务器等。同时开发了OpenClaw的语音处理技能和中间件脚本,实现了从接收语音消息到文本转换的完整流程。最终测试显示该功能在GLM-5和本地Ollama运行的q
在使用本地模型的时候,经常调用出现超时。我就多了几次测试:,单位是秒,配为1800时,就是30分钟。后台日志报的durationMs代表毫秒,即1/1000秒。为了更好的使用Ollama本地模型,减少超时,建议将超时时间改大写,我是设置为1800,即30分钟。当我改为1800之后,还时有很多超时,是因为有些Agent没有刷新配置,即使重启Gateway,也不会刷新,必须要新建Session,会通过
本文介绍了开发Android多重计时器App的曲折过程。作者先后尝试使用OpenClaw和Cursor两个AI工具进行开发,但首次OpenClaw开发的版本连基本倒计时功能都未实现,被迫重做。两个AI最终产出的App界面和功能差异明显:OpenClaw版本支持添加多个提醒节点,前几次弱提醒滴滴三声,最后一次强提醒;Cursor版本则呈现不同设计风格。作者特别指出AI开发的不可控性,同样的需求会产生
本文介绍了使用Skill-Vetter进行技能安全审计的实践。首先通过Clawhub登录并获取API token以解决限流问题,然后安装Skill-Vetter工具。文章指出正确用法是在聊天窗口直接发送扫描指令,而非生成Python脚本执行。作者通过错误示例展示了不当操作导致的扫描失败情况,强调应让大模型直接处理扫描请求。扫描结果展示了工具的基本检查功能,但需要注意正确使用方式以避免无效操作。
本文探讨了使用OpenClaw生成PPT的多种方法,介绍了OpenClaw通过Skill功能读取和编写pptx文件的操作流程,包括安装powerpoint-pptx技能、组建专业Agent团队进行内容分析,以及使用python-pptx生成基础PPT的过程。文章对比了不同技能生成的效果差异,指出当前方案在内容呈现和排版方面仍有优化空间,为后续探索不同技能生成效果提供了基础。
本文介绍了在WSL Ubuntu中取消自动挂载宿主机磁盘的方法。通过修改/etc/wsl.conf配置文件,关闭automount功能并启用fstab加载,然后编辑/etc/fstab文件手动指定需要挂载的磁盘路径(如D:盘挂载到/mnt/d)。重启验证后,只有指定磁盘被挂载,其他磁盘目录为空。文中还提供了备选的手动挂载命令方案。该方法解决了WSL默认自动挂载所有宿主磁盘的安全顾虑,同时保留了必要
第一次使用FunASR,对于它的原理、用法还不熟,借用AI,只是提高效率,对于我不熟、AI也不熟的地方,实在没有好的方法,只能一步一个脚印、走一步踩一坑地走下去。维度WebSocket服务器本地直接调用正确率大部分一样,最后一段差优加载速度优,免加载差,耗时识别速度同同性能消耗差,不用也会消耗优,按需调用内存占用差,持续占用内存优,按需调用由于我是要在OpenClaw中使用飞书调用FunASR识别
OpenClaw配置能力边界探索:通过实践验证其配置指导能力,发现能覆盖大部分配置需求但存在局限。测试显示OpenClaw能提供完整配置结构,但对特定细节解释不足。在自动更新方面,发现Node节点和飞书插件存在更新限制,提出脚本化解决方案。未来计划扩展安全检查功能。整体验证了OpenClaw在配置维护方面的实用价值,同时明确了其能力边界。
本文探讨了OpenClaw多Agent系统在飞书群组协作开发语音识别App时遇到的问题及解决方案。主要挑战包括:1)Agent任务状态不透明,采用定期扫描机制监控状态;2)Agent职责越界问题,需规范调用流程避免上下文错乱;3)跨Agent文件访问障碍,通过符号链接解决工作目录共享问题。这些实践经验为多Agent协作系统的稳定性与可控性提供了实用改进方案,对类似开发场景具有参考价值。
摘要:作者使用OpenClaw模拟开发团队开发语音识别Android App时遇到诸多问题。虽然AI反馈项目"高质量、高效率",但实际未完成交付。主要问题包括:Agent不遵守公共工作目录要求,BandCoder重复创建相同项目,导致token浪费。AI似乎忘记了项目产出应放在公共目录的原则,暴露出团队协作和指令执行方面的缺陷。







