2026山大软院创新实训——MarketClaw团队博客(六):从平台化底座到内容运营闭环
一、背景概述
本阶段,团队在四个方向上同步推进,形成了“平台底座 → 营销智能 → 内容挖掘 → 自动化执行”的完整链路:
一、持续推进 MarketClaw 平台化改造,完成真实大模型接入、多平台机器人入口、长期记忆管理、内容资产库与 Token 成本统计,让系统从 MVP 走向智能体运营平台;
二、独立构建 Marketing Mode 营销智能技能包,以“角色引擎 + 知识库引擎”双引擎架构,覆盖 6 大板块 23 个营销领域,为团队提供可复用的 AI 营销方法论;
三、攻克小红书评论区自动回复的核心难题,以 CDP 盲点方案替代传统 DOM 操作,将评论回复成功率从 0% 提升至 100%,并完成全链路架构重构;
四、开发爆款内容挖掘与评论回复管理两大 Skill,补齐了“写什么”的选题痛点和“怎么运营”的落地痛点,形成完整的新媒体运营工具链。
四条线各有侧重但高度协同:平台底座为所有 Skill 提供运行环境和可观测能力;营销知识库为内容生成提供策略框架;自动化执行让生成内容真正触达用户;爆款挖掘则为整个内容生产链路提供选题依据。本篇汇总这四方面工作,展示 MarketClaw 当前的整体进展。
二、工作总览
| 方向 | 核心产出 | 状态 |
|---|---|---|
| 平台化底座 | 真实大模型接入 + fallback、飞书/微信入口、三层记忆管理、内容资产库、Token 统计、任务详情增强、Skill 接入规范 | 核心功能完成,可多入口演示 |
| 营销智能引擎 | Marketing Mode Skill:双引擎架构,6 大板块 23 领域,140+ 战术创意,70+ 心理模型 | Skill 包完整可安装,框架已验证 |
| 评论区自动回复 | 盲点点击进入笔记、INITIAL_STATE 双通道评论提取、顶层评论回复、全链路重构 | 实测通过,成功率 100% |
| 爆款挖掘与评论管理 | 爆款内容挖掘 Skill(数据采集 + NLP 分析 + 评分排序)、评论回复管理 Skill(互动 + 数据 + 账号管理) | 核心功能完成,可部署运行 |
三、模块一:平台化底座——从 MVP 到多入口智能体平台
3.1 设计目标
将 MarketClaw 从一个“能在 Web 页面生成文案”的单入口 MVP,推进为一个具有真实模型驱动、多平台入口、长期记忆、内容资产沉淀和成本可观测能力的智能体运营平台。
3.2 真实大模型接入与稳定性保障
独立 LLM 服务层:设计 llm_service 统一处理模型调用,支持 DeepSeek 和 OpenAI-compatible 两种配置方式。关键设计在于将模型供应商与业务流程解耦——任务编排层只需调用一个 complete_json 获取结构化结果,无需关心底层模型细节。
Fast Workflow 模式:当配置真实 LLM 时,系统可用一次大模型请求生成完整的商品分析、热点匹配和小红书文案三段结果,再按权重拆分为三个 Skill 的 Token 和耗时记录。既保留前端 Skill 调用链展示,又减少模型调用次数,降低调试成本。
Fallback 兜底机制:模型 API 可能因网络、Key、余额或响应格式问题失败。系统增加了 fallback 设计:真实 LLM 调用失败时自动回退到本地 mock Skill,Skill 日志记录状态和错误原因,前端任务详情页可查看是否发生 fallback。这一设计让系统从“能调通”升级为“能解释失败、记录失败、兜底运行”。
3.3 多入口能力:Web + 飞书 + 微信
-
飞书入口:接收事件订阅 → URL verification → 提取用户 id 和文本 → 自动创建平台用户 → 调用统一营销任务流程 → 格式化回复。
-
微信入口:GET 回调服务器验证 → POST 接收消息 → 校验签名 → 解析 XML → 自动创建用户 → 调用统一流程 → XML 文本回复。
核心价值在于验证了任务服务层的抽象能力:无论请求来自 Web、飞书还是微信,最终都进入同一个 run_marketing_task 流程,仅在用户身份、source_platform 和回复格式上有所区别。后续接入 QQ 或其他平台无需重新编写营销生成逻辑。
3.4 长期记忆模块:从预留表到可管理功能
上一阶段仅有 UserPreference 和 MemoryItem 两张预留表。本阶段完成了接口和前端页面的落地:
-
记忆管理接口:获取偏好和记忆列表、新增/更新/删除用户偏好、新增 HOT/WARM/COLD 三层记忆、删除记忆条目;
-
记忆管理页面:可查看当前用户偏好和记忆记录,支持手动维护;
-
与生成流程打通:用户偏好和记忆已传入文案生成流程,为后续记忆召回和个性化生成打下基础。
3.5 内容资产与 Token 统计
-
内容资产库:解决“生成结果如何复用”的问题。支持按关键词、标签查询历史生成内容,让 MarketClaw 从一个“一次性生成工具”变为“营销内容工作台”。
-
Token 统计:从多维度呈现成本——总 Token、今日 Token、估算成本、平均每次调用 Token;按日期趋势、按 Skill 分布、按用户消耗、按模型消耗。让模型调用成本透明可追踪。
3.6 任务详情增强与团队规范
-
任务详情结构升级:新增
status_flow(任务状态流转)、trace(Skill 步骤级追踪)、token_distribution(Token 占比)、retry_records(fallback/异常记录)、source_platform(来源标识)。让任务详情从“展示结果”升级为“展示执行过程”。 -
Skill 接入规范:新增
SKILL_INTEGRATION.md和skill_template.py,明确每个 Skill 统一暴露run(input_data)函数、返回SkillResult结构、各 Skill 的固定字段要求,以及注册到SKILL_REGISTRY的流程。为团队并行开发提供了可执行的接口约定。
3.7 实测数据
当前数据库已有 21 条营销任务、63 条 Skill 调用记录、63 条 Token 记录、19 条内容资产、20 条记忆记录,系统在多次联调中逐步稳定。
四、模块二:营销智能引擎——Marketing Mode Skill 构建
4.1 设计理念
Marketing Mode 不是一个“营销 AI 工具”,而是一个 AI 角色 × 营销知识库的复合 Skill。核心设计选择:框架驱动而非答案驱动,角色一致而非风格随机。
4.2 双引擎架构
-
角色引擎(mode-prompt.md):定义 Mark 这个 AI 人格——增长痴迷、数据驱动、框架思维。标志性追问:“What’s the CTA?” “Who is this for?” “What’s the one thing they should remember?” 不直接给答案,而是先追问关键信息,再提供分析框架。
-
知识库引擎(SKILL.md,18KB):覆盖 6 大板块 23 个技能领域:
-
营销策略与框架:140+ 营销战术创意、五阶段发布策略、定价策略
-
心理学与心智模型:7 个基础思维模型 + 11 个说服心理学模型 + 5 个行为经济学效应
-
SEO 与内容:五层 SEO 审计框架、12 种程序化 SEO 玩法、5 个文案框架、七轮编辑法
-
转化率优化(CRO):落地页四要素、全链路漏斗优化、A/B 测试方法论
-
付费广告与增长:八大平台投放策略、追踪基建、推荐计划设计
-
邮件营销:五种邮件序列类型、生命周期营销策略
-
4.3 核心设计原则
-
Framework-first, not advice-first:给框架不给标准答案,因为营销没有标准答案;
-
Ask before tell:先追问五个关键信息(受众、目标行动、当前状态、渠道、指标);
-
Specific over generic:每一条战术都对应具体执行方式。
4.4 在 MarketClaw 中的价值定位
Marketing Mode 作为团队的内容生成“策略大脑”——当 MarketClaw 需要为某商品生成文案时,不是直接套模板,而是先调用营销框架分析(目标受众是谁?核心钩子是什么?用 AIDA 还是 PAS?),再驱动文案生成 Skill 输出具体内容。它提供的是“思考能力”而非单纯的“输出能力”。
五、模块三:小红书评论区自动回复——从 DOM 失联到自然语言回复
5.1 问题背景
上阶段完成的评论区自动回复系统在实际运行中暴露了两个致命问题:
-
进入笔记触发验证:
page.navigate(url)直接跳转触发小红书反爬风控; -
评论 DOM 不可达:评论区域非静态渲染,
#comment-{id}选择器经常落空。
此前 3 篇帖子共检测到 5 条新评论,0 条成功回复。
5.2 盲点方案突破
-
进入笔记:放弃
navigate,改为从用户主页通过 CDPmouse_click盲点点击笔记缩略图进入详情页。核心通过section.note-item选择器定位缩略图,获取视口绝对坐标后触发点击,浏览器将其识别为真实用户操作。实测 5 次盲点点击全部成功,0 次触发风控。 -
评论提取:利用
window.__INITIAL_STATE__双通道提取——优先从 INITIAL_STATE 获取(兼容探索页/用户主页/搜索结果/Feed 流四种页面结构),失败时回退 DOM 提取。 -
评论回复:从“定位具体评论 → 点击回复按钮 → 输入 → 提交”四步简化为“滚动到评论区 → 找到输入框 → 输入 → 提交”两步。放弃楼中楼回复的精准定位(因 DOM 结构限制几乎不可行),直接发表顶层评论确保功能可用。
5.3 关键经验
-
DOM 选择器在小红书的微前端 + React 架构下频繁失效,CDP 原生事件是最稳定的保底方案;
-
降级策略比完美方案重要——与其追求楼中楼回复,不如用顶层评论确保功能可用;
-
序列化兼容需要提前设计,评论 ID 持久化格式变更需兼容旧数据。
六、模块四:爆款内容挖掘与评论回复管理 Skill
6.1 爆款内容挖掘 Skill
解决“写什么”的选题痛点。
核心功能:
-
内容数据采集:对接多平台数据源,定向采集爆款内容基础信息;
-
NLP 特征分析:提取高频关键词、爆款标题句式、内容结构、情感倾向;
-
结果输出:以榜单、特征总结、创作建议形式呈现分析结果。
技术架构:
-
数据层:轻量级数据库存储采集内容与分析结果,支持数据更新;
-
算法层:文本处理算法 + 统计分析模型,识别爆款核心特征;
-
应用层:Web 框架实现交互,提供访问入口。
意图识别模块:通过关键词模糊匹配实现,支持全网热点查询、指定话题分析、选题策划等场景分流。
6.2 评论回复管理 Skill
解决“怎么运营”的落地痛点。
三大功能模块:
-
评论互动管理:获取评论列表、回复评论、删除评论、拉黑用户,含参数校验和合规性控制;
-
数据分析查询:单篇笔记数据、粉丝增长趋势、账号整体概览,支持自定义时间范围;
-
账号信息管理:个人资料修改、标签管理、关联账号绑定,严格遵循小红书字段校验规范。
风险管控:批量操作增加预览确认环节、敏感信息加密存储与日志脱敏、API 调用频率限制与异常自动停止。
6.3 在 MarketClaw 中的定位
爆款挖掘 Skill 为内容生成提供选题依据(“写什么”),评论管理 Skill 处理发布后的互动运营(“怎么运营”),两者与平台底座和自动化执行形成完整链路:选题 → 生成 → 发布 → 互动 → 数据回收 → 优化迭代。
七、当前整体进度对照
| 模块 | 完成情况 |
|---|---|
| Skill1:商品分析与文案生成 | 完成,已接入真实模型 |
| Skill2:热点信息采集 | 框架完成,待接入真实数据 |
| Skill3:小红书自动化执行 | 发布 + 评论回复均实测通过 |
| Skill4:账号预热与人群锚定 | 人设生成已完成,预热行为待完善 |
| Skill5:爆款分析与策略迭代 | 爆款挖掘 Skill 完成 |
| 创新点1:长期记忆层 | HOT/WARM/COLD 三层实现 |
| 创新点2:轻量级多入口对话 | 飞书/微信入口框架已搭建 |
| 创新点3:营销智能引擎 | Marketing Mode Skill 完成 |
| 内容运营工具链 | 爆款挖掘 + 评论管理 Skill 完成 |
八、总结
本阶段团队在四条线上同步推进,各自攻克了不同方向的核心难题,共同构建了 MarketClaw 从“平台底座”到“内容运营闭环”的完整能力:
-
平台化让系统从单入口 MVP 进化为可追踪、可观测、可记忆、可扩展的智能体平台;
-
营销智能引擎为内容生成提供了框架驱动的策略思考能力;
-
自动化执行通过盲点方案突破平台限制,让生成内容真正触达用户;
-
运营工具链补齐了选题挖掘和互动管理的完整链路。
这四条线技术栈各异(FastAPI/Vue/CDP/NLP/知识工程),但统一服务于同一个目标:打造一个真正能帮用户完成“选题 → 分析 → 生成 → 发布 → 互动 → 迭代”全流程的私人营销助理。当前版本已具备从策略思考到内容生产再到平台发布的完整闭环,后续工作将聚焦于真实数据接入、记忆驱动的个性化生成和整体演示效果的打磨。
项目博客地址:Cu-sir-CSDN博客
项目 Gitee 地址:https://gitee.com/cusir666/MarketClaw
更多推荐


所有评论(0)