logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

你睡一觉,AI 帮你试了一百种方案——Karpathy 的 AutoResearch 是怎么回事

Karpathy 在 2026 年 3 月发布了 autoresearch,一个让 AI coding agent 在夜里自主跑机器学习实验、保留改进、还原失败的框架。这篇介绍它的核心设计逻辑、实际效果,以及这套"循环实验"思路能延伸到哪些地方。

文章图片
#人工智能#机器学习
这个刚冲上 GitHub Trending 的 AI 插件,能帮你扒出全网过去 30 天最真实的讨论

经常用 AI 写代码或者查资料的人,大概都遇到过一个痛点:AI 的知识库总是有延迟的。当你问它“最近 Claude 出了什么新功能”或者“某个新框架的最优解是什么”,它通常会回答不知道,或者提供过时的资料。传统的搜索引擎也有些吃力。搜索结果里充斥着 SEO 内容和二手文章。为了搞清楚“这个技术到底有没有人在生产环境里用”,很多时候你只能手动去刷 Reddit、Twitter(X)或者 Hacker

文章图片
#github#人工智能
别让你的 Coding Agent 瞎忙活,你最缺的可能是这套 Harness 规则

Harness” 的字面本义是马具和缰绳。如果把大模型比作一匹能日行千里的马,那 Harness 就是配套的马鞍和缰绳体系。在传统软件开发中,这个词多数时候对应测试脚手架(Test Harness),是一套用来自动化跑输入、约束运行边界、验证结果的包裹环境。当 AI 接手项目里具体的编码任务时,Harness Engineering 指的就是给 Agent 搭建的这层项目“外包围”结构。模型不管多

文章图片
#人工智能
OpenAI 开始做 Codex Plugins 了

看到 OpenAI Developers 发了一条关于的推文,就去看了下文档了解了一下。我们平常会给 Codex 写 skill、接 MCP,也会把外部工具接进来。自己用的时候一般都还顺手,但是要给别人复用就比较麻烦。你得一遍遍解释 skill 放哪、MCP 怎么配、依赖先装什么、路径改哪里。这些事单独看都还好,放在一起就容易乱。Codex Plugins 处理的就是这件事。它把这些本来分散的东西

文章图片
#人工智能
    共 14 条
  • 1
  • 2
  • 请选择