logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Kimi Code 突然能看视频了?视频理解能力超过 Codex 和 Claude

Kimi Code的视频理解能力提升并非单一版本突破,而是框架层、提示词引导和工程补课三方面quietly stacked upgrade的结果。框架层早内置ReadMediaFile工具,近期通过提示词引导agent优先使用该工具;工程上修复了媒体文件丢失问题,使视频附件不再静默消失;产品层面将视频理解提升为一等公民。这种改进打开了UI复刻、Bug诊断、自动化剪辑和视频风格复刻等新场景,标志着多

文章图片
#音视频
Kimi Code 突然能看视频了?视频理解能力超过 Codex 和 Claude

Kimi Code的视频理解能力提升并非单一版本突破,而是框架层、提示词引导和工程补课三方面quietly stacked upgrade的结果。框架层早内置ReadMediaFile工具,近期通过提示词引导agent优先使用该工具;工程上修复了媒体文件丢失问题,使视频附件不再静默消失;产品层面将视频理解提升为一等公民。这种改进打开了UI复刻、Bug诊断、自动化剪辑和视频风格复刻等新场景,标志着多

文章图片
#音视频
OpenAI 终于给 Codex 装了个浏览器插件

OpenAI推出Codex Chrome插件,让AI直接访问用户真实浏览器环境。该插件突破传统AI仅能在代码仓库工作的限制,使AI能够查看和操作实际业务系统页面,大幅提升调试效率。但这也带来安全风险,因为AI可能接触到敏感数据和关键业务操作。文章建议谨慎使用该功能,优先在测试环境运行,并对生产环境设置严格权限控制。作者认为这一技术的关键在于如何平衡效率与安全,未来需要更细粒度的权限管理和操作审计功

文章图片
#人工智能
Codex 被爆藏着一个写爆你硬盘的 bug

摘要:OpenAI的AI编程工具Codex出现严重Bug,导致用户固态硬盘(SSD)在后台被疯狂写入数据,大幅缩短寿命。典型案例显示,有用户21天内被写入37TB数据,若持续一年将达640TB。该问题普遍存在于CLI、桌面版、VS Code扩展等所有Codex产品形态中。 问题根源在于Codex的日志系统设计缺陷:虽然用户可设置日志级别,但后台数据库仍默认记录全部数据,尤其"草稿账本"文件(WAL

文章图片
#人工智能#rust
SkillOpt: 让skills学会自我进化

文章摘要: 微软开源的SkillOpt项目提出了一种创新方法,通过优化AI agent的"操作手册"(SKILL.md)而非修改模型参数来提升任务性能。这种方法像为学生提供更好的复习笔记而非改变其大脑结构。SkillOpt的核心在于严格验证机制:每次修改后必须在验证集上测试,只有确实提升性能的修改才会被保留。实验数据显示,该方法在多个基准测试中显著提升任务成功率,有时仅修改一条规则就能实现近翻倍的

文章图片
#人工智能
SkillOpt: 让skills学会自我进化

文章摘要: 微软开源的SkillOpt项目提出了一种创新方法,通过优化AI agent的"操作手册"(SKILL.md)而非修改模型参数来提升任务性能。这种方法像为学生提供更好的复习笔记而非改变其大脑结构。SkillOpt的核心在于严格验证机制:每次修改后必须在验证集上测试,只有确实提升性能的修改才会被保留。实验数据显示,该方法在多个基准测试中显著提升任务成功率,有时仅修改一条规则就能实现近翻倍的

文章图片
#人工智能
SkillOpt: 让skills学会自我进化

文章摘要: 微软开源的SkillOpt项目提出了一种创新方法,通过优化AI agent的"操作手册"(SKILL.md)而非修改模型参数来提升任务性能。这种方法像为学生提供更好的复习笔记而非改变其大脑结构。SkillOpt的核心在于严格验证机制:每次修改后必须在验证集上测试,只有确实提升性能的修改才会被保留。实验数据显示,该方法在多个基准测试中显著提升任务成功率,有时仅修改一条规则就能实现近翻倍的

文章图片
#人工智能
SkillOpt: 让skills学会自我进化

文章摘要: 微软开源的SkillOpt项目提出了一种创新方法,通过优化AI agent的"操作手册"(SKILL.md)而非修改模型参数来提升任务性能。这种方法像为学生提供更好的复习笔记而非改变其大脑结构。SkillOpt的核心在于严格验证机制:每次修改后必须在验证集上测试,只有确实提升性能的修改才会被保留。实验数据显示,该方法在多个基准测试中显著提升任务成功率,有时仅修改一条规则就能实现近翻倍的

文章图片
#人工智能
OpenAI 的端午节礼物:Record & Replay

OpenAI在2026年端午节前夕推出Codex新功能Record & Replay,允许用户通过一次操作演示自动生成可复用的skill脚本,后续由AI自动执行重复流程。该功能将操作转化为结构化工作说明,适用于报销、报表归档等重复性任务,但对界面变化敏感且目前仅支持macOS。官方建议用户需人工补充分支逻辑并注意数据安全,强调生成结果需二次审查。该功能降低了自动化门槛,但可靠性依赖后期优化。

文章图片
#人工智能
AGENTS.md 越写越长,Codex 反而越用越笨?

如果一个团队现在的AGENTS.md已经很长了,最不值得做的事情,就是继续往里补。更值得做的,反而是四件事:• 把AGENTS.md缩回入口页• 把真正重要的事实拆进docs/• 把关键取舍补成版本化决策记录• 给仓库补一个一键真正让 Codex 变强的,很多时候不是更会写 prompt。而是更会整理项目。这可能才是下一阶段 AI 编程真正的分水岭。不是谁的提示词更长。而是谁先把自己的代码库,整理

文章图片
#人工智能
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择