logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

手搓Hermes Agent 的gpt-image-2生图插件: 支持代理站、可自定义分辨率

本文介绍了为解决Hermes Agent无法使用国内代理站调用GPT-Image-2生图功能而开发的插件解决方案。由于原生OpenAI provider的base_url不可配置,作者通过自定义ImageGenProvider实现了以下功能:1)支持从配置文件读取任意代理站URL;2)通过"WxH"格式支持自定义分辨率;3)自动将本地图片转为base64实现图生图功能。整个插件约300行代码,支持

文章图片
#python#AI作画
百度网盘全自动化实录:Hermes Agent + bb-browser

摘要:本文分享了如何利用bb-browser工具实现百度网盘全自动化操作的数字产品交付方案。作者通过对比Hermes自带工具和自开发方案的不足,最终选择让AI Agent直接调用已登录Chrome的网页接口。详细介绍了bb-browser的工作原理、百度网盘适配器的开发过程,以及文件查找、分享链接生成和上传功能的实现。该方案避免了验证码问题,利用真实浏览器登录态实现稳定操作,将网页操作转化为结构化

文章图片
#自动化#人工智能
给Hermes Agent打造个外挂大脑 - 开发记忆插件实录

Hermes记忆插件vecmem通过向量化技术解决了AI Agent记忆的两个核心问题:容量限制和语义联想。该插件采用sqlite-vec作为向量存储方案,实现三级降级嵌入引擎(API/本地/哈希),并融合向量语义搜索与FTS5关键词搜索。架构包含对话提取、嵌入引擎和向量存储三层,通过缓存机制优化性能。相比官方符号代数方案,vecmem提供更高精度的语义记忆,使AI能真正"理解"用户表述。项目已开

文章图片
#python#人工智能
你的 Hermes Agent 在烧 Token 吗? 一个插件帮你砍了 73%

《AI Agent优化:如何节省73%的token消耗》 摘要:使用Hermes Agent时发现,工具调用结果(如网页抓取、终端输出)会全量塞入上下文,导致单会话消耗近8万token。通过开发插件方案,在不动核心代码前提下,对超限结果进行头尾截断存储(保留关键信息,原文存盘),使token消耗从79,397降至20,817,节省73.7%。该方案针对不同工具设置差异化阈值(如终端输出保留尾部错误

文章图片
#python#人工智能
Hermes Agent给自己开了个外挂

AI Agent 15分钟零代码实现系统监控面板 本文记录了作者使用Hermes Agent在15分钟内为管理系统添加实时监控功能的全过程。AI Agent通过以下步骤自主完成任务: 分析Dashboard插件架构(3分钟) 编写后端API采集系统数据(2分钟) 开发前端React组件(4分钟) 修复注册方式和API认证问题(5分钟) 技术亮点: 采用psutil采集CPU/内存/磁盘/网络数据

文章图片
#python#机器学习#人工智能
百度网盘全自动化实录:Hermes Agent + bb-browser

摘要:本文分享了如何利用bb-browser工具实现百度网盘全自动化操作的数字产品交付方案。作者通过对比Hermes自带工具和自开发方案的不足,最终选择让AI Agent直接调用已登录Chrome的网页接口。详细介绍了bb-browser的工作原理、百度网盘适配器的开发过程,以及文件查找、分享链接生成和上传功能的实现。该方案避免了验证码问题,利用真实浏览器登录态实现稳定操作,将网页操作转化为结构化

文章图片
#自动化#人工智能
Hermes多Agent技能管理面板开发实战

这篇文章介绍了作者为解决Hermes Agent多Profile模式下技能包管理混乱的问题,自主开发了一个Skills管理面板的过程。文章首先描述了技能包分散在不同Agent中导致的管理痛点,然后详细说明了管理面板的6个核心需求功能。技术选型采用Electron、React 19、TypeScript 6等最新技术栈,采用三栏式UI设计实现高效浏览。核心功能包括目录扫描、一键部署和版本同步,通过递

文章图片
#人工智能#typescript#vscode
PDF 发票提取技能包:MinerU + Agent Skill,零模型零 GPU 方案

本文介绍了一个名为 pdf-mineru 的 Agent Skill 工具,用于高效提取中文 PDF 文档(如发票、合同、财报等)的结构化数据。该工具基于 MinerU 云 API(国产开源项目,66k⭐),无需本地安装模型或 GPU,每日免费支持1万页解析。实测显示,它能准确提取发票号码、金额、买卖方信息,并将表格转为HTML格式,中文排版效果优于 pymupdf 和 marker-pdf。支持

文章图片
#python#人工智能
PDF 发票提取技能包:MinerU + Agent Skill,零模型零 GPU 方案

本文介绍了一个名为 pdf-mineru 的 Agent Skill 工具,用于高效提取中文 PDF 文档(如发票、合同、财报等)的结构化数据。该工具基于 MinerU 云 API(国产开源项目,66k⭐),无需本地安装模型或 GPU,每日免费支持1万页解析。实测显示,它能准确提取发票号码、金额、买卖方信息,并将表格转为HTML格式,中文排版效果优于 pymupdf 和 marker-pdf。支持

文章图片
#python#人工智能
在 VS Code 里跑一个多 Agent 团队:Hermes ACP 集成实录

本文介绍了如何将Hermes Agent与VS Code集成,通过ACP协议实现智能开发辅助。主要内容包括:安装ACP依赖和客户端扩展;配置registryDir解决连接问题;利用profile机制实现多Agent协作(前端、后端、测试等不同角色),每个Agent拥有独立配置;最终在VS Code侧边栏快速切换不同功能的Agent。这种集成方式让开发者无需离开编辑器就能获得专业AI辅助,显著提升开

文章图片
#人工智能#visual studio code
    共 20 条
  • 1
  • 2
  • 请选择