logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为什么 AI Agent 重新爱上了文件系统(Filesystems)

大家开始编写 aboutme.md 文件,来充当可移植的身份描述 —— 你的偏好、你的技能、你的工作风格,全都放在一个文件里,这个文件可以在不同应用间流转,无需任何人去对接 API。而是说:你的数据、你的上下文、你的偏好、你的技能、你的记忆 —— 以一种你拥有的格式存在着,任何智能体都能读取,不会被锁死在某个特定的应用里。他指出,Claude Code 之所以有效,是因为它运行在你的电脑上,使用你

文章图片
#人工智能#AI
Prompt caching 技术是如何实现 1 折的推理成本优化的?

如果你刚刚才处理完 “Mary had a”,那么在生成下一个 token 时,对 “Mary had a little” 中前三个 token 的大部分矩阵运算其实是冗余的 —— 而这正是 LLM 推理循环的默认行为。于是我决定深入探究,一头扎进 LLM 工作原理的“兔子洞”,直到彻底搞明白服务商究竟缓存了哪些精确的数据、这些数据的用途,以及它们如何让每个人的 LLM 请求都变得更快速、更便宜。

文章图片
#人工智能#AI
目前市场上似乎只有三类真正可行的 AI 产品

最终,你只能给 chatbots 配备那些用户自己也能完成的操作,可这样一来,你的 chatbots 其实是在跟你自家产品的原生体验竞争,而且大概率会输。首款基于大语言模型的产品 ChatGPT,其功能只不过是^1(译者注:文中出现的数字,为注释上标,文末可看到对应的注释内容,后同)与模型本身进行对话:换句话说,就是一个纯粹的 chatbot。由 LLM 生成的补全内容让用户无需改变现有工作流的任

文章图片
#人工智能#AI
以 Nano-vLLM 为例,深入理解 LLM 推理引擎(Part 2)

相反,每个 head 执行一次投影(projection),这是一种通过学习得到的变换方式,将完整的 4096 维输入压缩成该 head 特有的 128 维表征。Nano-vLLM 则做了简化,仅支持 Qwen 模型,但背后遵循的工程模式和优化思路,其实是通用的。这个是可以训练出来的。尽管单位参数的效率有所损失,但凭借其庞大的总体规模,它可以达到的能力,是任何可训练的稠密模型都无法企及的。输出是

文章图片
#人工智能#AI
为什么 AI 巨头们放弃私有壁垒,争相拥抱 Agent Skills

文中深入剖析了技能加载的“渐进式披露”机制如何大幅降低 Token 消耗,对比了其与微调、Custom Instructions 等方案的优劣,并展示了开发者生态在三周内从 0 爆发至 25,000 个技能的惊人增长。云内容管理公司 Box 构建的 Skills,能将存储的文件自动转换为符合组织标准的格式化文档。如果你正在构建 AI 智能体、交付 AI 驱动的产品,或是设计未来需要对接多家 AI

文章图片
#人工智能#AI
OpenClaw 架构详解 · 第二部分:并发、隔离以及确保智能体正常运行的不变量(Invariants)

我们今天为大家带来的文章,作者的观点是:构建可靠 AI 智能体系统的关键,不在于精巧的提示词,而在于通过强制执行少量核心不变量(Invariants)来管理并发和状态,将自主性约束在可控范围内。如果你见过 Agent “疯狂刷屏回复”,或者在执行中途“无视用户的纠正”,那么上文提到的队列模式(queue modes)就是控制这些行为的“调节旋钮”。一个不那么光鲜但真实的事实:决定你的 Agent

文章图片
#人工智能#AI
解构 MCP 的伪需求与 CLI 的真价值

文章也坦承,MCP 在某些缺乏 CLI 的场景下仍有其存在意义,但警示开发者不应本末倒置 —— 在没有提供基础 CLI 和 API 的情况下,优先投入资源去构建 MCP 服务器。MCP 曾许诺提供更简洁的接口,但在实际操作中,我发现自己到头来还是得写同样的文档:每个工具是干什么的,接受哪些参数,更重要的是,什么时候该用它。我们今天为大家带来的这篇文章,作者的核心观点是 MCP(模型上下文协议)并非

文章图片
#人工智能#AI
为什么 AI Agent 重新爱上了文件系统(Filesystems)

大家开始编写 aboutme.md 文件,来充当可移植的身份描述 —— 你的偏好、你的技能、你的工作风格,全都放在一个文件里,这个文件可以在不同应用间流转,无需任何人去对接 API。而是说:你的数据、你的上下文、你的偏好、你的技能、你的记忆 —— 以一种你拥有的格式存在着,任何智能体都能读取,不会被锁死在某个特定的应用里。他指出,Claude Code 之所以有效,是因为它运行在你的电脑上,使用你

文章图片
#人工智能#AI
Claude Code中的Commands→Skills→Agents是进阶路径?你可能理解错了

作者通过“代码整洁度检查”这一完整示例,清晰展示了如何组合使用 Command + Agent 实现手动流程,或 Skill + Agent 实现智能主动介入,并强调 —— 选择依据不应是“功能复杂度”,而应是“谁来决定执行时机”。Command 是手动触发器。Agent 并非比 Command “更高级” —— Command 是触发器,Agent 是执行者,它们扮演着不同的角色。Command

文章图片
#AI#人工智能
分享一些编程助手使用过程中的经验教训与观察思考

其次,他揭示了模型“求快”的默认性格需通过“惯用性”提示词加以约束,并惊叹于Opus 4.5与GPT 5.2在Bug定位上的惊人能力,但也警示,过度依赖AI会导致开发者心智模型保真度快速衰减,进而缩短代码库的“品质半衰期”;软件工程的核心始终在于:与团队协作来深入理解问题的本质,编写代码将解决方案落地,排查并修复 Bugs,同时随着问题的变化持续迭代优化方案。据我观察,即使有最好的提示词工程支持,

文章图片
#人工智能#AI
    共 157 条
  • 1
  • 2
  • 3
  • 16
  • 请选择