翔云123456 个人主页

@lanyang123456

翔云123456

2022-07-25 18:27:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

claude-context 本地部署方案

本文介绍了一种完全离线的本地化解决方案，用于对接本地部署的Claude-Code。该方案采用全本地架构，包括本地Milvus向量数据库、Ollama开源嵌入模型、本地构建的MCP索引服务和本地Claude-Code客户端，无需依赖任何云端API。安装过程包括配置Docker、Node.js、pnpm和Ollama环境，启动本地Milvus向量库和嵌入模型，构建Claude-Context服务，并进

#AI

OpenClaw与Claude Code相似之处

两者虽定位有别（Claude Code专注编程专家，OpenClaw偏向通用智能体），但在技术基础、交互范式与核心能力上高度一致，均代表AI辅助开发的重要方向。OpenClaw可视为Claude Code的社区扩展版，提供更灵活的部署与定制选项，而Claude Code则具备官方支持与更稳定的企业级特性。

#AI

OpenClaw与Claude Code的Skill比较

两者的Skill系统在核心设计理念、基础结构与使用体验上几乎一致，共享Agent Skills的技术基因，是AI智能体能力扩展的标准化解决方案。差异主要体现在执行效率、扩展自由度与生态定位上，用户可根据需求选择更适合的平台，而无需重新学习技能开发范式。需要我整理一份SKILL.md的最小兼容模板（包含必要元数据与触发示例），让你能快速写出同时适配两者的技能吗？

#AI

claude-context -- 让AI 能深度理解和检索代码库

claude-context是Zilliz开发的开源MCP插件，为AI编程助手提供语义代码搜索能力。它通过将代码库转化为向量数据库索引，实现自然语言查询代码功能，解决AI处理大型代码库时的关键痛点：上下文窗口限制、手动传递低效、代码理解不全和跨模块协作难。核心技术包括代码AST解析、向量嵌入、混合搜索和智能分块。提供多个变体版本满足不同场景需求，适用于大型项目开发、代码重构、Bug调试等场景，显著

#人工智能 #AI

OpenClaw新会话记忆加载过程

在 OpenClaw 里，新会话刚启动时，记忆不是一次性全塞给模型，而是走一套非常固定、轻量的初始化加载 + 按需召回流程。下面用最清晰、最贴近源码逻辑的方式讲：新会话开始时，记忆的完整使用流程。

claude-context 本地部署方案

#AI

端侧推理：全面解析与深度洞察

本质：将AI计算从云端数据中心下沉到离用户/数据源最近的终端设备，实现"数据不出设备"的智能处理闭环。本地执行：模型推理在终端硬件上完成，无需数据上传至云端服务器资源受限：运行环境通常有CPU/GPU算力、内存、存储和功耗的严格限制轻量高效：需通过模型优化适配端侧硬件，平衡精度与性能实时响应：消除网络传输延迟，实现毫秒级决策。

vLLM（Very Large Language Model inference）是由加州大学伯克利分校LMSYS团队于2023年6月开源的高性能大模型推理与服务引擎，专注解决大模型部署中的显存效率低、吞吐量瓶颈、延迟高三大核心问题。核心技术创新PagedAttention（分页注意力）：借鉴操作系统虚拟内存管理思路，将KV缓存分割为固定大小的块，内存浪费控制在4%以内，支持动态分配与释放，单卡

#AI #人工智能

vLLM全解析：定义、用途与竞品对比

#AI #人工智能

共 56 条

请选择