decipher_wang 个人主页

@decipher_wang

decipher_wang

2025-04-16 09:35:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

上下文是你的 · Agent 是雇的 · 三步节省 90% Token 账单

摘要： TELOS SDK 通过优化大模型推理的缓存机制，显著降低对话式AI的Token消耗成本。其核心创新在于：极致Token效率：6轮真实对话节省92.3%成本，48次调用实测节省36.6%（净省$2.16），按绝对美元计价；上下文主权归还：通过引擎无关的TelosIR数据结构，实现人设、工具链等跨平台迁移（Claude/DeepSeek/vLLM等）；结构化缓存协议：采用三色带（PIN

#人工智能

清华LeapLab开源cooragent框架：一句话构建您的本地智能体服务群

清华黄高教授团队开发的开源框架Cooragent，旨在简化智能体的创建与协作。该框架由清华 MEM 工程管理硕士王政领导，支持通过简单指令生成定制化智能体，如 AI 情报收集秘书，并允许智能体之间协同工作。Cooragent 的核心特点包括可编辑的 AGI、零 Prompt 依赖、动态上下文理解等，支持两种工作模式：Agent Factory 和 Agent Workflow。其 Prompt-F

#python #人工智能

为什么大模型时代人人都需要懂 KV Cache

KV Cache是大模型时代的关键优化技术，它通过缓存注意力机制中的Key和Value矩阵，避免了重复计算，将生成token的计算复杂度从O(N²)降为O(N)。文章揭示了两层核心价值：单次生成时的加速，以及跨请求前缀缓存带来的成本优化。重点指出前缀缓存命中率完全取决于prompt字节稳定性，提出三条工程原则：瞬时信息后置、只追加不改写、保持序列化稳定。随着agent应用普及，KV Cache从底

#人工智能 #github

为什么大模型时代人人都需要懂 KV Cache

#人工智能 #github

上下文是你的 · Agent 是雇的 · 三步节省 90% Token 账单

#人工智能

比 Claude Desktop 更加方便的本地智能体服务

与众多 MCP 框架不同的是 Cooragent 能够无感支持众多的 MCP 服务。Cooragent 即能够自动集成 MCP Tools，并且自动在任务中选择需要的 tool，以完成用户指定的任务。比起其他的框架，甚至是 Claude Desktop，Cooragent 使得用户对 MCP 的使用难度几乎降低到 0。中定义的这些 MCP 服务注册为可用工具。之后，智能体 (Agent) 在规划和

#chrome #前端

到底了