logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

(随想)显卡里的幽灵:我们是否也只是几分钟前被唤醒的玻尔兹曼大脑?

之前一直用kimi2.5的API,每月花不少钱,肉疼。今天一咬牙,在自己的游戏显卡(RTX 4080)上部署GLM-4.7-Flash。GPU嗡嗡响了几分钟,权重加载完毕,模型真跑起来了。我接上hermes,开始对话。说实话,之前还担心本地部署的中等模型效果会比不上kimi几千亿参数的大模型。结果用下来,几乎没什么区别。它还记得我们之前聊过的话题,记得我的习惯,调用工具和技能也还是一样得心应手。如

文章图片
#服务器#前端#linux
手搓轮子!轻量级RAG MCP工具,让Hermes秒懂你的Obsidian笔记

本文介绍了一个为Obsidian笔记用户开发的轻量级本地RAG工具FileRAG-MCP。作者针对现有方案(关键词检索、云服务RAG、自建RAG)存在的效率低、成本高、隐私风险等问题,基于LlamaIndex和FastAPI开发了一个开源解决方案。该工具采用ChromaDB向量数据库,支持MCP协议与主流AI框架对接,具有轻量(单Python脚本运行)、本地化(数据不上传)、增量更新等特点。文章详

文章图片
#人工智能
拒绝为“工具说明书”买单:为什么开发者开始从MCP转向CLI?

对比项MCPCLIToken消耗高低配置复杂度高低执行速度相对慢快适用场景特定工具封装几乎所有场景当然,MCP不是没有价值。对于一些复杂的、需要封装的工具链,特别是企业级应用这种需要安全和可控的场景下,MCP提供了一种标准化的管理方式。但如果你追求的是"简单高效、花更少的钱、办更多的事"——CLI确实是一个更务实的选择。

文章图片
#人工智能
写了18个Skill只活了6个?别怪AI记性差,是你的“路由”没写对

文章摘要:作者在使用Hermes创建多个Skill后发现,许多Skill未被自动触发。通过研读官方指南,发现问题在于Skill描述(frontmatter description)过于简略。好的描述应包含核心能力、触发场景和边界说明,相当于自然语言路由。指南建议采用三级知识结构:简要描述(第一级)、完整指令(第二级)和外部资源(第三级)。Skill编写应从具体用例出发,明确触发条件、步骤和结果,并

文章图片
#人工智能
写了18个Skill只活了6个?别怪AI记性差,是你的“路由”没写对

文章摘要:作者在使用Hermes创建多个Skill后发现,许多Skill未被自动触发。通过研读官方指南,发现问题在于Skill描述(frontmatter description)过于简略。好的描述应包含核心能力、触发场景和边界说明,相当于自然语言路由。指南建议采用三级知识结构:简要描述(第一级)、完整指令(第二级)和外部资源(第三级)。Skill编写应从具体用例出发,明确触发条件、步骤和结果,并

文章图片
#人工智能
手搓轮子!轻量级RAG MCP工具,让Hermes秒懂你的Obsidian笔记

本文介绍了一个为Obsidian笔记用户开发的轻量级本地RAG工具FileRAG-MCP。作者针对现有方案(关键词检索、云服务RAG、自建RAG)存在的效率低、成本高、隐私风险等问题,基于LlamaIndex和FastAPI开发了一个开源解决方案。该工具采用ChromaDB向量数据库,支持MCP协议与主流AI框架对接,具有轻量(单Python脚本运行)、本地化(数据不上传)、增量更新等特点。文章详

文章图片
让远程AI的“眼睛”长在你桌面上:解决反爬与验证码介入的终极方案

摘要: 本文探讨了AI自动化工具在网页验证码环节面临的挑战,并提出基于X11转发的远程浏览器解决方案。当前AI处理复杂验证码的成功率极低(图形验证码<5%,人脸识别≈0%),而传统方案存在成本高或兼容性问题。作者详细介绍了三步配置流程:1)在Windows安装VcXsrv作为X11服务器;2)配置SSH客户端启用X11转发;3)在Linux端启动带显示参数的Chrome浏览器。该方案实现了服

文章图片
#人工智能
让远程AI的“眼睛”长在你桌面上:解决反爬与验证码介入的终极方案

摘要: 本文探讨了AI自动化工具在网页验证码环节面临的挑战,并提出基于X11转发的远程浏览器解决方案。当前AI处理复杂验证码的成功率极低(图形验证码<5%,人脸识别≈0%),而传统方案存在成本高或兼容性问题。作者详细介绍了三步配置流程:1)在Windows安装VcXsrv作为X11服务器;2)配置SSH客户端启用X11转发;3)在Linux端启动带显示参数的Chrome浏览器。该方案实现了服

文章图片
#人工智能
到底了