
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Karpathy 在 2026 年 3 月发布了 autoresearch,一个让 AI coding agent 在夜里自主跑机器学习实验、保留改进、还原失败的框架。这篇介绍它的核心设计逻辑、实际效果,以及这套"循环实验"思路能延伸到哪些地方。

经常用 AI 写代码或者查资料的人,大概都遇到过一个痛点:AI 的知识库总是有延迟的。当你问它“最近 Claude 出了什么新功能”或者“某个新框架的最优解是什么”,它通常会回答不知道,或者提供过时的资料。传统的搜索引擎也有些吃力。搜索结果里充斥着 SEO 内容和二手文章。为了搞清楚“这个技术到底有没有人在生产环境里用”,很多时候你只能手动去刷 Reddit、Twitter(X)或者 Hacker

Harness” 的字面本义是马具和缰绳。如果把大模型比作一匹能日行千里的马,那 Harness 就是配套的马鞍和缰绳体系。在传统软件开发中,这个词多数时候对应测试脚手架(Test Harness),是一套用来自动化跑输入、约束运行边界、验证结果的包裹环境。当 AI 接手项目里具体的编码任务时,Harness Engineering 指的就是给 Agent 搭建的这层项目“外包围”结构。模型不管多

看到 OpenAI Developers 发了一条关于的推文,就去看了下文档了解了一下。我们平常会给 Codex 写 skill、接 MCP,也会把外部工具接进来。自己用的时候一般都还顺手,但是要给别人复用就比较麻烦。你得一遍遍解释 skill 放哪、MCP 怎么配、依赖先装什么、路径改哪里。这些事单独看都还好,放在一起就容易乱。Codex Plugins 处理的就是这件事。它把这些本来分散的东西












