
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Andrej Karpathy提出"LLMWiki"概念,颠覆传统RAG系统的知识管理方式。传统RAG每次查询需重新检索和拼凑信息,缺乏积累;而LLMWiki通过LLM主动构建和维护结构化Markdown知识库,实现知识的持久化、关联化与动态更新。
AI 在企业的竞争,已经从"模型能力竞争"切换到"上下文密度竞争"
记忆压缩是解决Agent系统长期运行中信息过载的核心技术,通过平衡信息保留与存储成本,实现高效运行。其目标包括控制存储规模、提升检索效率和保持关键信息。压缩方法可分为三类:规则压缩:如截断、时间衰减,简单高效但可能丢失重要信息。智能抽取:如关键词提取、语义去重,保留核心语义但依赖模型质量。生成式摘要:如多粒度摘要、增量摘要,质量高但计算成本较大。
本文系统分析了Agent开发中的安全风险,提出了五层防御体系。风险分为P0-P3四个优先级,重点包括工具滥用、数据泄露、Prompt注入等。防御体系涵盖输入拦截、上下文隔离、工具管控、输出过滤和审计追溯,并强调可观测性和降级熔断两项基础能力。特别指出模型层风险需特殊处理,工具层决定损失上限,多Agent系统存在级联放大风险。建议采用结构化输入校验、Capability-based访问控制、敏感信息
Anthropic团队发布的这篇文章系统介绍了Claude Code在大型代码库中的应用方案。核心创新点在于其agentic搜索机制,不同于传统RAG工具,它通过实时遍历文件系统工作,无需维护代码索引。
【摘要】Anthropic发布了Claude托管代理的"内置内存"功能,突破传统AI会话无记忆的局限,实现跨会话持续学习。该功能通过文件系统存储记忆,支持智能筛选、版本控制与权限管理,满足企业级安全需求。实际案例显示,该功能可减少97%重复错误,提升30%文档处理效率。作为企业AI解决方案的关键环节,内存功能与代码理解、安全部署共同构成完整技术栈,适用于复杂任务场景,现已开放测
用户请求 -> 控制面(Web UI、CLI Tools) -> Gateway(安全认证、路由分发) -> 消息通道(归一化) -> 核心引擎(模型)<-> 扩展层(Skills、Cron Job、Plugins) -> 响应返回。
在分步提问的过程中,你可以和AI大语言模型“协同思考”,在每次提问获得AI大语言模型反馈后,利用自己的智慧结合AI大语言模型的回答,分析并及时调整下一步的提问方向,以便得出比AI大语言模型自身推理所能得到的更好的最终答案。5W是指When(什么时间)、Who(什么人)、Where(什么地方)、Why(什么原因)、What(什么事情),1H是指How(怎么做)使用角色扮演是一种效果非常显著的策略,A

我们通常可以通过约定输出格式、通过样本约束输出格式。

输入部分包含了AI执行任务所需的数据或信息。:这是框架的第一部分,它明确了你希望AI执行的具体任务或动作。这可以包括任务的背景、目的、历史信息或其他任何有助于AI更好地理解和执行任务的信息。:提供关于请求的详细上下文和背景信息,帮助AI更准确地理解需求和面对的具体情境,使得生成的回答更加贴近实际问题和目的。:定义AI在对话中扮演的角色,如专家、顾问、朋友等,为对话建立框架,让AI知道应该以何种专业








