Starry-sky(jing) 个人主页

@llm765800916

Starry-sky(jing)

2022-07-08 17:27:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Hermes Agent v0.18.0 升级实战：1953个commit带来的3个性能提升与1个致命坑

Hermes Agent v0.18.0 升级实战：1953 个 commit 带来的性能提升与一个致命坑> 摘要：6 月 19 日刚升完 v0.17.0，7 月 1 日 v0.18.0 又来了—

#运维 #gateway

Hermes Agent v0.18.0 升级实战：1953 个 commit 带来的性能提升与一个致命坑

Hermes Agent v0.18.0 升级实战：1953 个 commit 带来的性能提升与一个致命坑> 摘要：6 月 19 日刚升完 v0.17.0，7 月 1 日 v0.18.0 又来了—

#运维 #gateway

AI Agent 长期记忆系统实战：Hindsight + vLLM 全本地 GPU 部署

本文介绍了为AI Agent构建本地记忆系统的方案，重点推荐Hindsight作为记忆系统提供者，并提出三种部署模式：最简模式（local_embedded）- 适合快速体验，使用CPU运行BGE-small模型本地GPU加速模式 - 连接外部GPU服务器提升embedding性能全Docker部署模式 - 推荐方案，各组件独立容器化，便于维护升级文章特别分享了在Jetson Orin设备

#人工智能

AI Agent 长期记忆系统实战：Hindsight + vLLM 全本地 GPU 部署

#人工智能

AI Agent 长期记忆系统实战：Hindsight + vLLM 全本地 GPU 部署

#人工智能

AI Agent 长期记忆系统实战：Hindsight + vLLM 全本地 GPU 部署

#人工智能

RAG 重排序模型实测：MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神（Jetson GPU部署）

RAG 重排序模型实测：MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神（Jetson GPU 部署）问题：RAG 中文搜不出来，不是向量库的锅你的 R

#RAG #Jetson

AI Agent Skill 膨胀治理实战：242个Skill吃掉4.5M Token——SkillReducer压缩60%（附审计脚本）

AI Agent Skill 膨胀治理实战：242 个 Skill 吃掉 4.5M Token——SkillReducer 压缩 60% + 三条铁律锁死 Token 浪费问题：Skill 越多

AI Agent 系统瘦身实战：五层审计法清理磁盘垃圾与记忆碎片（附自动化脚本）

AI助手系统运维实战：从文件系统到向量记忆的五层审计方法论，包含完整的清理脚本和安全注意事项。

2026 年本地 AI 编程工具部署指南：Codex CLI 与 Claude Code 实战

2026年本地AI编程工具部署指南本文详细介绍了2026年主流本地AI编程工具Codex CLI和Claude Code的部署与使用方法。Codex CLI基于GPT-5-Codex模型，支持Git仓库上下文操作、自定义Agent配置和Git Worktree并行任务。Claude Code提供桌面客户端和CLI两种形态，支持管道模式、MCP协议集成和权限控制。两种工具都需要付费订阅，适合需要代

#人工智能

共 14 条

请选择