用 TrendRadar搭建自己的科技资讯日报系统
用开源项目、RSS、AI Agent 和 IM 机器人,把每天刷信息流这件事自动化
|
这不是一篇“万能新闻助手”教程,更像是一份折腾记录:我想把每天手动刷信息流这件事,改成一条每天自己跑的 RSS 日报流水线。 |
信息时代信息本身已经不稀缺了,稀缺的是注意力。
每天打开微信、X.com、GitHub、技术博客、播客和新闻客户端,都有一堆东西等着你看。AI 模型又发了,某个 Agent 框架又火了,一个开源项目突然冲上 Trending,某家公司又融资。单看每条都像有点价值,合在一起就很乱。
我之前也会每天刷这些信息源。刷完的感觉常常是:好像看了很多,但真要说今天有什么值得记下来,反而说不清。标题党、营销号、重复报道和碎片观点把注意力切得很碎,最后留下来的东西并不多。
所以我想做一个比较笨但稳定的小系统:每天固定时间,把我关心的技术信息收进来,先过滤掉明显不想看的内容,再把英文标题翻成中文,最后生成一份可以扫读的日报,推到钉钉或飞书里。
最后的方案
最后跑通的是这个组合:TrendRadar + BestBlogs RSS + GitHub Trending + IM 推送。BestBlogs 提供 RSS 源,TrendRadar 负责抓取和报告,额外脚本补 GitHub Trending,再顺手把英文标题翻成中文。
|
环节 |
说明 |
|
1. 输入源 |
BestBlogs RSS、公众号 RSS、技术博客、播客、X.com、GitHub Trending |
|
2. 抓取处理 |
TrendRadar 定时抓取、去重、失败源记录、历史归档 |
|
3. 过滤分类 |
按 AI 模型、AI 工程、开源工具、基础设施、数据库等主题聚合 |
|
4. 翻译增强 |
英文标题和 GitHub Trending 项目介绍转成中文,本地缓存翻译结果 |
|
5. 输出推送 |
生成 Markdown / HTML 日报,并推送到钉钉、飞书或企业微信 |
图 1:从 RSS 输入到日报推送的大致流程。
为什么最后还是回到 RSS
这套东西不是我一开始就想好的。
最早我试过 Hermes Agent + tech-news-digest Skill。思路很简单:让 Agent 自己去看技术新闻,然后整理成日报。听起来挺顺,实际跑起来就没那么顺。
第一个卡点是 X.com。现在很多 AI 一线信息都在 X.com 上。模型公司、研究员、开源作者、投资人,很多人都是先发一条动态,再过一阵子才被写成博客或媒体文章。但 X.com 如果走 API,就得配 API Key,还得考虑额度、权限和稳定性。为了一个个人日报系统专门维护这套东西,我觉得有点重。
后来我又试过让 Codex 直接操作浏览器去抓。这个方式临时用很好,比如让它打开网页、搜索、读几篇文章,然后总结一下。但如果要每天定时跑,就不太舒服了。浏览器抓取依赖页面状态,也不太适合直接接到钉钉、飞书、企业微信这种 IM 推送链路里。它更像一次性调研工具,不像一个稳定的后台任务。
微信公众号这边甚至更麻烦。很多中文技术内容还在公众号里,但公众号生态本来就比较封闭。你想直接抓文章,会遇到搜索限制、登录态、风控、链接变化等一堆问题。偶尔抓一下可以,长期稳定监控就很别扭。
TrendRadar 刚好补上了后半段:它能抓 RSS、做关键词过滤、生成报告,也能接通知推送。BestBlogs 又已经整理了一批质量还不错的 RSS 源,包括公众号、技术博客、播客、X.com 等。两者拼在一起,刚好够用。
用到的项目和数据源
TrendRadar 项目地址:https://github.com/SANSAN0/TrendRadar

图 2:TrendRadar GitHub 项目页。
BestBlogs 项目地址:https://github.com/ginobefun/BestBlogs
本文使用的 OPML:https://github.com/ginobefun/BestBlogs/blob/main/BestBlogs_RSS_ALL.opml

图 3:BestBlogs_RSS_ALL.opml,里面包含公众号、技术博客、播客、X.com 等 RSS 源。
我怎么过滤
BestBlogs 的 ALL 源很全,但全都接进来并不代表全都要看。我更关心 AI 和工程落地,所以先把前端技术、设计体验、营销活动和官媒内容过滤掉。否则日报很快又会变成另一个信息流。
- 保留:AI 模型、AI 工程、Agent、MCP、开源工具、基础设施、数据库、芯片机器人、AI 商业化。
- 过滤:前端框架、设计体验、招聘课程、营销活动、明显官媒来源。
- 翻译:英文标题和 GitHub Trending 项目介绍优先显示中文,原文保留在链接里。
我给 Agent 的提示词
真正搭的时候,我没有一行行手写完整流程,而是把目标、数据源、过滤口径和输出形式说清楚,让 Agent 去读 TrendRadar 项目、改配置、补脚本、试运行。大概可以这样写:
我想用 SANSAN0/TrendRadar 搭一个个人科技资讯日报。
数据源使用 BestBlogs_RSS_ALL.opml,先同步里面的 RSS 源。
请帮我过滤掉前端技术、设计体验、招聘课程、营销活动和官媒内容,
重点保留 AI 模型、AI 工程、Agent、MCP、开源工具、基础设施、数据库、芯片机器人、AI 商业化等方向。
日报需要包含:RSS 抓取统计、主题热度、来源贡献、代表性文章、GitHub Trending。
英文标题和 GitHub Trending 项目介绍请翻译成中文,并做本地缓存,避免每天重复翻译。
输出 Markdown 和 HTML 两份报告,HTML 方便阅读,Markdown 方便归档。
最后接入钉钉/飞书/企业微信机器人推送摘要和报告链接。
请把任务整理成一个每天上午 10 点自动运行的脚本,并帮我试跑一次看效果。
这段提示词里最重要的不是某个命令,而是把“不看什么”和“重点看什么”讲明白。剩下的安装、依赖、配置文件和定时任务,交给 Agent 处理就好。
生成出来是什么样
跑完之后,会得到一份 HTML 日报和一份 Markdown 报告。HTML 用来看,Markdown 用来归档或者继续处理。报告里会显示 RSS 源成功率、文章数量、主题热度、来源贡献、GitHub Trending,以及每个主题下比较有代表性的文章。

图 4:生成后的日报页面,包含 RSS 抓取统计和 GitHub Trending。
推到 IM 里
这套东西真正让我愿意继续用,是因为它不需要我每天主动打开某个页面。到点之后,它自己抓取、过滤、翻译、生成报告,然后把摘要推到钉钉或飞书里。我只要在 IM 里扫一眼,大概就知道今天哪些方向值得继续看。
我这里用的是钉钉机器人 webhook。飞书、企业微信也差不多,本质上就是把最后的 Markdown 摘要转成机器人能接受的格式,然后 POST 到 webhook。
迁移和定时运行
这类任务最好放到一台常开的机器上。我最后把它迁到一台 Mac mini,用 launchd 每天 10 点执行。相比依赖 Codex 自动化,launchd 更像一个真正的后台任务:机器开着就跑,不需要打开某个聊天窗口。
一些实际踩坑
- BestBlogs 的 RSS源很多,第一次跑需要根据自己的兴趣继续删源,不要指望一次过滤就完美。
- X.com 内容很有价值,但最好通过已有 RSS 转换服务接入,自己直接走 API 成本不低。
- 微信公众号不适合直接网页抓取,RSS 转换服务能省掉很多登录态和风控问题。
- 推送消息里不要塞太长正文,摘要 + HTML 链接会更舒服。
最后
RSS 提供稳定输入,TrendRadar 负责抓取和过滤,Agent 负责帮我写脚本、调配置、补功能、迁移机器。最后留下来的,是一套每天自己运行的个人科技资讯日报系统。
信息太多的时候,再多打开几个信息源其实意义不大。更重要的是有一套自己的过滤器。它不需要替你判断一切,只要每天帮你把噪音降下来,把值得看的东西放到面前,就已经很有价值。
项目引用链接
|
项目 |
链接 |
用途 |
|
TrendRadar |
RSS 抓取、过滤、报告生成和通知推送。 |
|
|
BestBlogs |
整理高质量公众号、博客、播客、X.com 等 RSS 源。 |
|
|
BestBlogs_RSS_ALL.opml |
github.com/ginobefun/BestBlogs/blob/main/BestBlogs_RSS_ALL.opml |
本文使用的全量 OPML RSS 源入口。 |
|
GitHub Trending |
补充当天热门开源项目。 |
|
|
Codex |
用于辅助配置、调试、迁移和自动化脚本编写。 |
更多推荐

所有评论(0)