
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
OpenAI 2 月发了篇 Harness Engineering 文章,讲他们用 Codex 搭了一个让 Agent 持续工作的执行环境。我读完觉得里面很多东西是可以蒸馏成 Claude Code Skill 的,花了点时间提炼了四个:`harness`(持久执行)、`closed-loop-testing`(闭环测试)、`architecture-guardrails`(架构约束)、`harn

AI 最大的问题,从来不是“不会做”,而是“每次都做得不一样”。

2026年2月,OpenAI的工程师Ryan Lopopolo在官方博客发布了一篇看似平淡的技术文章。文章描述了一个内部实验:一个3人小组,用5个月时间,构建并上线了一个拥有百万行代码的生产级产品。

过去一段时间,如果尝试过用claude-code 官方的`skills-creator`构建agent skills,大概率会发现:agent自己构建的skills往往不好用。于是乎,为了验证一个新写的 Skill 是否真正有效,不得不陷入无止境的“修改 Prompt -> 手动跑测试 -> 检查结果” 的循环中。

思维链提示* 发起一项行动,让大模型观察所选环境的反馈* 在流程中收集所有信息并使用它来决定下一步采取什么合适的行动

在最近 Google Cloud Tech 发布的一篇内容中,作者 Shubham Saboo 和 Lavini Nigam 提出了一个非常重要的转变:Agent开发的核心,已经从“格式规范”转向“能力设计”。

OpenClaw,前身叫 Clawdbot,因商标纠纷数次改名,吉祥物是一只龙虾,在 72 小时内积累了超过 6 万 GitHub Star,随后飙升至 24 万,成为 GitHub 有史以来增速最快的项目之一,近期已经突破30万 star,火遍大江南北。

大模型学习的底层根基,核心围绕自然语言处理、神经网络、Transformer架构、预训练/微调/对齐四大核心知识点展开,拆解大模型实现语言理解与生成的底层逻辑,掌握这些内容能从本质上理解大模型的工作原理,为后续的架构选型、训练优化等学习打下基础。

在第二篇中,我们将文档分块后通过Embedding模型转换为高维向量。现在假设你的知识库有100万个文档块,每个都变成了一条1024维的向量。用户提了一个问题,也被转成了向量——接下来怎么找到最相关的那几条?

论文提出SG2 的框架,用于在复杂环境的场景图(scene graph)上进行更可靠、更高效的空间推理与任务规划。








