用开源项目、RSSAI Agent IM 机器人,把每天刷信息流这件事自动化

这不是一篇万能新闻助手教程,更像是一份折腾记录:我想把每天手动刷信息流这件事,改成一条每天自己跑的 RSS 日报流水线。

信息时代信息本身已经不稀缺了,稀缺的是注意力。

每天打开微信、X.com、GitHub、技术博客、播客和新闻客户端,都有一堆东西等着你看。AI 模型又发了,某个 Agent 框架又火了,一个开源项目突然冲上 Trending,某家公司又融资。单看每条都像有点价值,合在一起就很乱。

我之前也会每天刷这些信息源。刷完的感觉常常是:好像看了很多,但真要说今天有什么值得记下来,反而说不清。标题党、营销号、重复报道和碎片观点把注意力切得很碎,最后留下来的东西并不多。

所以我想做一个比较笨但稳定的小系统:每天固定时间,把我关心的技术信息收进来,先过滤掉明显不想看的内容,再把英文标题翻成中文,最后生成一份可以扫读的日报,推到钉钉或飞书里。

最后的方案

最后跑通的是这个组合:TrendRadar + BestBlogs RSS + GitHub Trending + IM 推送。BestBlogs 提供 RSS 源,TrendRadar 负责抓取和报告,额外脚本补 GitHub Trending,再顺手把英文标题翻成中文。

环节

说明

1. 输入源

BestBlogs RSS、公众号 RSS、技术博客、播客、X.com、GitHub Trending

2. 抓取处理

TrendRadar 定时抓取、去重、失败源记录、历史归档

3. 过滤分类

按 AI 模型、AI 工程、开源工具、基础设施、数据库等主题聚合

4. 翻译增强

英文标题和 GitHub Trending 项目介绍转成中文,本地缓存翻译结果

5. 输出推送

生成 Markdown / HTML 日报,并推送到钉钉、飞书或企业微信

1:从 RSS 输入到日报推送的大致流程。

为什么最后还是回到 RSS

这套东西不是我一开始就想好的。

最早我试过 Hermes Agent + tech-news-digest Skill。思路很简单:让 Agent 自己去看技术新闻,然后整理成日报。听起来挺顺,实际跑起来就没那么顺。

第一个卡点是 X.com。现在很多 AI 一线信息都在 X.com 上。模型公司、研究员、开源作者、投资人,很多人都是先发一条动态,再过一阵子才被写成博客或媒体文章。但 X.com 如果走 API,就得配 API Key,还得考虑额度、权限和稳定性。为了一个个人日报系统专门维护这套东西,我觉得有点重。

后来我又试过让 Codex 直接操作浏览器去抓。这个方式临时用很好,比如让它打开网页、搜索、读几篇文章,然后总结一下。但如果要每天定时跑,就不太舒服了。浏览器抓取依赖页面状态,也不太适合直接接到钉钉、飞书、企业微信这种 IM 推送链路里。它更像一次性调研工具,不像一个稳定的后台任务。

微信公众号这边甚至更麻烦。很多中文技术内容还在公众号里,但公众号生态本来就比较封闭。你想直接抓文章,会遇到搜索限制、登录态、风控、链接变化等一堆问题。偶尔抓一下可以,长期稳定监控就很别扭。

TrendRadar 刚好补上了后半段:它能抓 RSS、做关键词过滤、生成报告,也能接通知推送。BestBlogs 又已经整理了一批质量还不错的 RSS 源,包括公众号、技术博客、播客、X.com 等。两者拼在一起,刚好够用。

用到的项目和数据源

TrendRadar 项目地址:https://github.com/SANSAN0/TrendRadar

2TrendRadar GitHub 项目页。

BestBlogs 项目地址:https://github.com/ginobefun/BestBlogs

本文使用的 OPML:https://github.com/ginobefun/BestBlogs/blob/main/BestBlogs_RSS_ALL.opml

3BestBlogs_RSS_ALL.opml,里面包含公众号、技术博客、播客、X.com RSS 源。

我怎么过滤

BestBlogs 的 ALL 源很全,但全都接进来并不代表全都要看。我更关心 AI 和工程落地,所以先把前端技术、设计体验、营销活动和官媒内容过滤掉。否则日报很快又会变成另一个信息流。

  • 保留:AI 模型、AI 工程、Agent、MCP、开源工具、基础设施、数据库、芯片机器人、AI 商业化。
  • 过滤:前端框架、设计体验、招聘课程、营销活动、明显官媒来源。
  • 翻译:英文标题和 GitHub Trending 项目介绍优先显示中文,原文保留在链接里。

我给 Agent 的提示词

真正搭的时候,我没有一行行手写完整流程,而是把目标、数据源、过滤口径和输出形式说清楚,让 Agent 去读 TrendRadar 项目、改配置、补脚本、试运行。大概可以这样写:

我想用 SANSAN0/TrendRadar 搭一个个人科技资讯日报。

数据源使用 BestBlogs_RSS_ALL.opml,先同步里面的 RSS 源。

请帮我过滤掉前端技术、设计体验、招聘课程、营销活动和官媒内容,

重点保留 AI 模型、AI 工程、Agent、MCP、开源工具、基础设施、数据库、芯片机器人、AI 商业化等方向。

日报需要包含:RSS 抓取统计、主题热度、来源贡献、代表性文章、GitHub Trending。

英文标题和 GitHub Trending 项目介绍请翻译成中文,并做本地缓存,避免每天重复翻译。

输出 Markdown 和 HTML 两份报告,HTML 方便阅读,Markdown 方便归档。

最后接入钉钉/飞书/企业微信机器人推送摘要和报告链接。

请把任务整理成一个每天上午 10 点自动运行的脚本,并帮我试跑一次看效果。

这段提示词里最重要的不是某个命令,而是把“不看什么”和“重点看什么”讲明白。剩下的安装、依赖、配置文件和定时任务,交给 Agent 处理就好。

生成出来是什么样

跑完之后,会得到一份 HTML 日报和一份 Markdown 报告。HTML 用来看,Markdown 用来归档或者继续处理。报告里会显示 RSS 源成功率、文章数量、主题热度、来源贡献、GitHub Trending,以及每个主题下比较有代表性的文章。

4:生成后的日报页面,包含 RSS 抓取统计和 GitHub Trending

推到 IM 里

这套东西真正让我愿意继续用,是因为它不需要我每天主动打开某个页面。到点之后,它自己抓取、过滤、翻译、生成报告,然后把摘要推到钉钉或飞书里。我只要在 IM 里扫一眼,大概就知道今天哪些方向值得继续看。

我这里用的是钉钉机器人 webhook。飞书、企业微信也差不多,本质上就是把最后的 Markdown 摘要转成机器人能接受的格式,然后 POST 到 webhook。

迁移和定时运行

这类任务最好放到一台常开的机器上。我最后把它迁到一台 Mac mini,用 launchd 每天 10 点执行。相比依赖 Codex 自动化,launchd 更像一个真正的后台任务:机器开着就跑,不需要打开某个聊天窗口。

一些实际踩坑

  • BestBlogs 的 RSS源很多,第一次跑需要根据自己的兴趣继续删源,不要指望一次过滤就完美。
  • X.com 内容很有价值,但最好通过已有 RSS 转换服务接入,自己直接走 API 成本不低。
  • 微信公众号不适合直接网页抓取,RSS 转换服务能省掉很多登录态和风控问题。
  • 推送消息里不要塞太长正文,摘要 + HTML 链接会更舒服。

最后

RSS 提供稳定输入,TrendRadar 负责抓取和过滤,Agent 负责帮我写脚本、调配置、补功能、迁移机器。最后留下来的,是一套每天自己运行的个人科技资讯日报系统。

信息太多的时候,再多打开几个信息源其实意义不大。更重要的是有一套自己的过滤器。它不需要替你判断一切,只要每天帮你把噪音降下来,把值得看的东西放到面前,就已经很有价值。

项目引用链接

项目

链接

用途

TrendRadar

github.com/SANSAN0/TrendRadar

RSS 抓取、过滤、报告生成和通知推送。

BestBlogs

github.com/ginobefun/BestBlogs

整理高质量公众号、博客、播客、X.com 等 RSS 源。

BestBlogs_RSS_ALL.opml

github.com/ginobefun/BestBlogs/blob/main/BestBlogs_RSS_ALL.opml

本文使用的全量 OPML RSS 源入口。

GitHub Trending

github.com/trending

补充当天热门开源项目。

Codex

openai.com/codex/

用于辅助配置、调试、迁移和自动化脚本编写。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐