项目名称:MarketClaw——你的私人产品营销助理
团队博客总览:https://blog.csdn.net/2401_83356673?type=blog
本阶段时间:2026年4月22日 — 2026年4月27日

一、引言

自第一期团队博客完成项目启动与初步环境搭建后,MarketClaw团队进入了技术深度探索与核心模块预研的关键阶段。本次团队博客将汇总四位成员在各自方向上的第二期个人博客成果,内容涵盖:

  • 张桐:AI Agent框架OpenClaw的本地部署实践,记录9个典型问题及解决思路,为项目底座的可靠运行扫清障碍;

  • 商玉雷:小红书自动化MCP方案受挫后,果断转向Chrome扩展 + WebSocket方案,成功实现搜索与推荐内容获取;

  • 张垿赫:深入分析Nanobot框架的桥接层、测试层以及经典skills(weather/memory),并完成项目六大模块划分;

  • 许泽榕:系统学习大模型训练全流程(预训练、SFT、LoRA、DPO、知识蒸馏),为后续可能的模型微调与对齐储备核心技能。

四位成员的博客虽然侧重点不同,但共同指向一个目标:为MarketClaw构建稳定、智能、可扩展的营销Agent系统。下面按照个人工作依次展开。

二、队长张桐:OpenClaw本地部署与9类典型问题解决

2.1 工作背景

在MarketClaw主体开发正式启动前,我希望通过完整部署一个成熟的AI Agent框架(OpenClaw,原名Clawdbot),深入理解其Skill管理、模块加载、分层记忆等机制,为团队后续设计提供直接参考。

2.2 测试环境

  • 操作系统:Windows 11

  • Node.js v22.14.0,pnpm v10.32.1

  • OpenClaw版本:2026.4.15-beta.1(源码编译)

2.3 9个典型问题与解决方案

整个部署耗时约3天,记录20余个报错,最终成功跑通。最具代表性的问题有:

问题 现象 解决方案
PowerShell执行策略限制 无法加载脚本 Set-ExecutionPolicy RemoteSigned
缺少Bash环境 bash 命令找不到 安装Git for Windows并加入PATH
Git克隆需登录 镜像仓库报错 改用GitHub公开仓库
pnpm全局链接失败 ERR_PNPM_NO_GLOBAL_BIN_DIR pnpm setup后重启终端
openclaw命令找不到 无该命令 手动创建openclaw.cmd包装器
配置向导中技能强制选择 clawhub依赖Go,无法跳过 选择其他技能绕过或Ctrl+C退出
Web UI无法访问(404) 根路径被拒绝 openclaw dashboard获取带token的URL
日志未显示Control UI信息 未出现启动日志 信任dashboard命令输出
进程无法优雅终止 端口被占用 netstat+taskkill强制结束

2.4 对MarketClaw的参考价值

  • 环境检测:建议提供doctor命令,自动检查权限、依赖、端口占用。

  • 跨平台构建:核心脚本应使用Node.js跨平台API,避免依赖Unix Shell。

  • 技能配置:允许用户跳过所有技能安装,且区分“推荐技能”与“高级技能”。

  • Web UI认证:采用一次性token + 会话超时,并提供dashboard命令。

三、商玉雷:小红书自动化——从MCP超时到Chrome扩展方案的完整演进

3.1 前序问题与方案调整

上一阶段我基于MCP协议搭建了xiaohongshu-mcp服务端,完成协议握手,但实际调用search_feeds接口时持续超时。分析原因可能为:上游服务响应延迟、HTTP客户端未配置超时控制。考虑到风控规避与登录态维护的难度,我决定放弃MCP方案,转向Chrome扩展 + 本地WebSocket桥接

3.2 技术方案对比

维度 HTTP模拟 Playwright Chrome扩展+WebSocket
登录态维护 定期更新Cookie 独立Cookie存储 自动继承浏览器状态
风控触发概率 较高 中等 较低
开发难度 高(逆向) 中等 较高
环境依赖 仅HTTP客户端 需浏览器驱动 需安装扩展

最终选用Chrome扩展方案,因其在风控规避和登录态维护上优势明显。

3.3 系统架构

采用三层进程协作模型:

text

OpenClaw (AI框架) ←→ Python CLI (技能执行器) ←→ Chrome扩展 (真实浏览器)
  • OpenClaw:接收自然语言指令,调度技能。

  • Python CLI:解析参数,管理WebSocket连接,实现超时与重试。

  • Chrome扩展:Background脚本创建WS服务,Content脚本执行DOM操作(搜索、滚动、抓取)。

3.4 关键实现与难点

  • 通信协议:自研基于JSON的简易RPC,包含idmethodparamstimeout字段。

  • SPA页面适配:小红书为单页应用,通过chrome.tabs.onUpdated监听URL变化并重新注入Content Script。

  • 异步加载等待:使用MutationObserver等待搜索结果渲染完成后再提取数据。

3.5 实验结果

当前已稳定完成:

  • ✅ 登录状态检测

  • ✅ 推荐内容获取

  • ✅ 关键词搜索(返回标题、作者、点赞数)

  • ⚠️ 点赞操作(偶发元素定位偏移)

  • 🔄 评论操作(测试中)

示例输出(脱敏):

{
  "success": true,
  "keyword": "济南 旅游",
  "count": 22,
  "items": [
    {"title": "济南三天两夜旅游攻略", "author": "用户****", "likes": "1.2万"}
  ]
}

3.6 总结与展望

投入约11天,完成从MCP到Chrome扩展的完整技术转型,产出可复用的小红书自动化技能。后续将完善点赞、评论稳定性,并封装行为仿真模块为通用库。

四、张垿赫:Nanobot框架深入与项目模块规划

4.1 框架核心层再理解

继上一篇博客介绍Nanobot主体后,本周重点学习了桥接适配层(bridge/)测试保障层(tests/)

  • 桥接层:负责将核心框架的抽象接口转化为具体外部服务(LLM、电商API、社交媒体)的请求,同时将外部事件转化为框架事件。实现更换模型供应商或业务平台时核心代码零修改。

  • 测试层:包含单元测试(核心模块)、集成测试(框架与桥接层交互)、端到端测试(完整营销场景),保障全链路质量。

4.2 经典Skills研读

(1) Weather Skill
  • 无需API密钥,仅依赖系统curl

  • 通过metadata.nanobot.requires.bins声明依赖,框架自动检测。

  • 利用wttr.in服务输出纯文本、自定义格式、天气图片等。

(2) Memory Skill
  • 双层记忆架构MEMORY.md(长期记忆,自动加载到上下文)和HISTORY.md(历史日志,不自动加载,主动检索)。

  • 检索策略:小文件用read_file,大文件用grep命令提高性能。

  • 自动整合:对话过长时自动总结并追加到HISTORY.md,关键事实提取到MEMORY.md

这对MarketClaw的创新点1(三层记忆HOT/WARM/COLD) 提供了直接实现参考。

4.3 OpenClaw部署问题补充

我在部署OpenClaw时也遇到三个典型问题:

  • sharp依赖安装失败npm install --build-from-source=sharp解决。

  • 模型API调用失败:逐一检查API Key、baseUrl、账户余额、网络连通性。

  • 杀毒软件误删文件:添加白名单,重新解压。

4.4 项目模块划分

基于前期学习和项目目标,我完成了MarketClaw的六大模块划分:

模块 核心功能
商品分析与文案生成Skill 结构化解析、人群分析、小红书图文生成
热点信息采集Skill 微博热搜、小红书话题热度、竞品检索
小红书自动化执行Skill 自动发布、评论获取、情感分析、智能回复
账号预热与人群锚定Skill 账号人设生成、预热行为规划
爆款分析与策略迭代Skill 数据采集、爆款特征提取、模板库动态更新
支撑创新Skill 长期记忆自学习、轻量级聊天交互、多场景营销物料生成

4.5 下周计划

开始具体Skills的开发,并与小组成员讨论接口对接细节。

五、许泽榕:大模型训练微调全流程学习

5.1 学习动机

MarketClaw的核心依赖大模型的生成能力。为了更好地理解模型行为,并为可能的专属营销模型微调做技术储备,我系统学习了从预训练到对齐的完整流程。

5.2 数据格式与处理

  • 预训练:JSONL格式纯文本,{"text": "..."},任务为Next Token Prediction。

  • SFT:多轮对话格式,含system/user/assistant角色,只对assistant回答部分计算loss(通过Loss Mask实现)。

  • DPO:包含chosenrejected偏好对,用于直接偏好优化。

5.3 关键机制

  • Loss Mask:SFT中必须将prompt部分的loss置0,否则模型会“学歪”。

  • 梯度累积:用多个小batch累加梯度模拟大batch,突破显存限制。

  • 学习率调度:Warmup + 余弦退火,兼顾训练初期稳定和后期收敛。

  • 混合精度(AMP):使用BF16(优于FP16)减少显存并加速。

5.4 高效微调与对齐

  • LoRA:低秩适应,只训练旁路矩阵,参数量仅为全参微调的2%左右。秩r通常取4~16,加在Attention的Q/K/V/O投影层效果最佳。

  • 知识蒸馏:区分黑盒(用大模型生成数据训练小模型)和白盒(学习logits分布)。温度T > 1时可放大“暗知识”,提高学生模型效果。

  • DPO:相比于传统RLHF(需要训练奖励模型+PPO),DPO直接从偏好数据优化策略,实现简单且稳定。

5.5 对MarketClaw的启发

  • 文案生成质量提升:未来可收集团队内部的高质量“商品→文案”数据,进行LoRA微调,让模型更贴合小红书风格。

  • 评论情感分析:可用蒸馏技术将大模型情感判别能力迁移到轻量级模型,降低推理成本。

  • 长期记忆:记忆库中的优质营销模板可作为DPO中的chosen样本,引导模型生成更优内容。

六、团队共识与总结

通过本阶段(2026年4月22日 — 2026年4月27日)的个人探索,团队在四个关键方向上都取得了实质性突破:

  • 底层框架(张桐):OpenClaw成功部署,为后续Skill集成提供稳定底座。

  • 业务自动化(商玉雷):小红书核心操作(搜索、推荐抓取)已打通,可投入实际使用。

  • 架构与规范(张垿赫):明确六大模块划分,并借鉴Nanobot记忆系统设计。

  • 模型技术储备(许泽榕):掌握微调与对齐方法,为模型定制打下基础。

团队将继续通过个人博客记录每日进展,保持高频同步,确保项目按任务书要求稳步推进。


项目代码https://gitee.com/cusir666/MarketClaw
团队博客https://blog.csdn.net/2401_83356673?type=blog

成员个人博客

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐