logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3-8B 难堪大任?我们可能问错了问题:算清 hermes-agent 自训那条路的成本与生态位

真训权重要接 Tinker+WandB?算总账:WandB 个人 100GB 全免,Tinker 按 token 计单次几十到百来美金;Qwen3-4B 微调能在 7/8 任务上追平 30 倍参数的 GPT-OSS-120B。

文章图片
hermes-agent 真的会自我训练吗:被‘self-improving‘误导的人都没看清这层

hermes-agent 把'自我进化'切成两层:API 模式只刷 skills 和 memory;真训权重必须接 Atropos+Tinker,且被训的不是 Claude,是 Qwen3-8B 这种开源权重。

文章图片
hermes-agent 真的会自我训练吗:被‘self-improving‘误导的人都没看清这层

hermes-agent 把'自我进化'切成两层:API 模式只刷 skills 和 memory;真训权重必须接 Atropos+Tinker,且被训的不是 Claude,是 Qwen3-8B 这种开源权重。

文章图片
Agent 记忆系统也需要 GC:拆解 Cowork 的 consolidate-memory

Cowork 把整理记忆切成一个独立 skill,背后藏着写入与反思的责任分割:在线写入只追加,离线再做合并、修正、清理。这条边界画得干净,是 Anthropic 的设计哲学。

文章图片
续之三:嵌套式 DevOps Agent 的记忆要分两层——Cowork 项目装组织上下文,Claude Code Skills 装仓库上下文

嵌套式 DevOps Agent 的记忆要分两层:Cowork 项目装组织上下文(团队/runbook/incident),Claude Code Skills 装仓库上下文(代码/雷区)。混在一起一定丢东西。

文章图片
Mac用户狂喜!一文带你读懂PyTorch在Apple Silicon上的MPS加速引擎

M4芯片跑AI大模型靠什么?PyTorch内置的MPS(Metal Performance Shaders)到底是什么?本文带你硬核解析苹果设备上的GPU加速技术,解锁Mac做深度学习的性能密码。

文章图片
AI去水印技术原理解析:为什么LaMa模型比传统TELEA更好?

在视频去水印和图像修复中,到底该选传统的TELEA还是深度学习的LaMa?本文通过原理对比,带你了解LaMa是如何通过FFC(快速傅里叶卷积)解决大块缺失区域和复杂背景的修复难题的。

文章图片
极客专属:一行命令搞定AI画图,告别繁琐代码!

遇到外语“生肉”视频没有字幕?甚至想把外语直接变成中文配音?得益于AI大模型和语音克隆技术,现在的开源工具已经能实现一键全自动翻译加配音。本文盘点4款顶级开源项目。

文章图片
#AI
极客专属:一行命令搞定AI画图,告别繁琐代码!

遇到外语“生肉”视频没有字幕?甚至想把外语直接变成中文配音?得益于AI大模型和语音克隆技术,现在的开源工具已经能实现一键全自动翻译加配音。本文盘点4款顶级开源项目。

文章图片
#AI
看懂生肉不是梦:GitHub开源AI视频翻译与配音神器盘点

遇到外语“生肉”视频没有字幕?甚至想把外语直接变成中文配音?得益于AI大模型和语音克隆技术,现在的开源工具已经能实现一键全自动翻译加配音。本文盘点4款顶级开源项目。

文章图片
    共 182 条
  • 1
  • 2
  • 3
  • 19
  • 请选择