logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent 长期记忆系统实战:Hindsight + vLLM 全本地 GPU 部署

本文介绍了为AI Agent构建本地记忆系统的方案,重点推荐Hindsight作为记忆系统提供者,并提出三种部署模式: 最简模式(local_embedded)- 适合快速体验,使用CPU运行BGE-small模型 本地GPU加速模式 - 连接外部GPU服务器提升embedding性能 全Docker部署模式 - 推荐方案,各组件独立容器化,便于维护升级 文章特别分享了在Jetson Orin设备

#人工智能
AI Agent 长期记忆系统实战:Hindsight + vLLM 全本地 GPU 部署

本文介绍了为AI Agent构建本地记忆系统的方案,重点推荐Hindsight作为记忆系统提供者,并提出三种部署模式: 最简模式(local_embedded)- 适合快速体验,使用CPU运行BGE-small模型 本地GPU加速模式 - 连接外部GPU服务器提升embedding性能 全Docker部署模式 - 推荐方案,各组件独立容器化,便于维护升级 文章特别分享了在Jetson Orin设备

#人工智能
AI Agent 长期记忆系统实战:Hindsight + vLLM 全本地 GPU 部署

本文介绍了为AI Agent构建本地记忆系统的方案,重点推荐Hindsight作为记忆系统提供者,并提出三种部署模式: 最简模式(local_embedded)- 适合快速体验,使用CPU运行BGE-small模型 本地GPU加速模式 - 连接外部GPU服务器提升embedding性能 全Docker部署模式 - 推荐方案,各组件独立容器化,便于维护升级 文章特别分享了在Jetson Orin设备

#人工智能
AI Agent 长期记忆系统实战:Hindsight + vLLM 全本地 GPU 部署

本文介绍了为AI Agent构建本地记忆系统的方案,重点推荐Hindsight作为记忆系统提供者,并提出三种部署模式: 最简模式(local_embedded)- 适合快速体验,使用CPU运行BGE-small模型 本地GPU加速模式 - 连接外部GPU服务器提升embedding性能 全Docker部署模式 - 推荐方案,各组件独立容器化,便于维护升级 文章特别分享了在Jetson Orin设备

#人工智能
RAG 重排序模型实测:MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神(Jetson GPU部署)

RAG 重排序模型实测:MiniLM → BGE-Reranker-v2-m3 替换全流程——中文召回从废到神(Jetson GPU 部署)问题:RAG 中文搜不出来,不是向量库的锅你的 R

#RAG#Jetson
AI Agent Skill 膨胀治理实战:242个Skill吃掉4.5M Token——SkillReducer压缩60%(附审计脚本)

AI Agent Skill 膨胀治理实战:242 个 Skill 吃掉 4.5M Token——SkillReducer 压缩 60% + 三条铁律锁死 Token 浪费问题:Skill 越多

AI Agent 系统瘦身实战:五层审计法清理磁盘垃圾与记忆碎片(附自动化脚本)

AI助手系统运维实战:从文件系统到向量记忆的五层审计方法论,包含完整的清理脚本和安全注意事项。

2026 年本地 AI 编程工具部署指南:Codex CLI 与 Claude Code 实战

2026年本地AI编程工具部署指南 本文详细介绍了2026年主流本地AI编程工具Codex CLI和Claude Code的部署与使用方法。Codex CLI基于GPT-5-Codex模型,支持Git仓库上下文操作、自定义Agent配置和Git Worktree并行任务。Claude Code提供桌面客户端和CLI两种形态,支持管道模式、MCP协议集成和权限控制。两种工具都需要付费订阅,适合需要代

#人工智能
Hermes Agent 接入 Qwen3.7-Max 报 401?OpenCode Go 模型路由源码级排查与修复

层次问题根因表象报 HTTP 401API 格式不匹配直接原因请求走到了OpenCode Go 的 qwen3.7-max 需要 Anthropic 格式代码层面始终为三条代码路径均未调用模型感知的路由函数架构层面同一个 provider 的不同模型需要不同 API 协议Hermes 的 api_mode 在 agent 初始化时一刀切。

#golang#chrome#开发语言 +1
机器学习三 归一化_正则化_多项式升维

一. 归一化1.归一化的目的把数据变为(0,1)之间的数 ,使得在梯度下降的过程中,不同维度的θ值(或w)参数可以在接近的调整幅度上。保持数据在迭代过程中的θ值幅度基本一致。2.常用的归一化类别最大值最小值归一化参数解释:Xjmin:X 矩阵中第 j 列特征值的最小值,Xjmax: X 矩阵中第 j 列特征值的最大值,Xij :X 矩阵中第 i 行第 j 列的数值,X*i,j : 归一化之后的 X

#机器学习#人工智能#python
    共 12 条
  • 1
  • 2
  • 请选择