手把手教你用ClawdBot搭建Telegram全能翻译官:语音/图片/汇率一键搞定

[【一键部署镜像】ClawdBot
开源、离线、零配置的Telegram多模态AI助手,内置语音转写、图片OCR、实时翻译、汇率查询、天气预报、维基百科快捷检索,树莓派4实测稳定运行。

镜像地址:CSDN星图镜像广场 - ClawdBot
GitHub项目(原名MoltBot):https://github.com/moltbot/moltbot](https://github.com/moltbot/moltbot)

你是否遇到过这些场景?

  • 群聊里突然刷出一串日文商品说明,没人能立刻看懂;
  • 朋友发来一张手写便签照片,想快速知道内容却要手动打字识别;
  • 出差前查不到实时汇率,临时换汇总怕被坑;
  • 想给海外同事发语音消息,又担心口音太重对方听不懂……

别再切APP、开网页、复制粘贴了。今天这篇教程,就带你用一条命令,在本地设备上跑起一个真正「开箱即用」的Telegram翻译官——它不依赖云端API、不上传隐私数据、不收订阅费,语音、图片、文字、汇率、天气,全在一台树莓派或普通服务器上离线完成。

1. 为什么选ClawdBot?不是另一个“翻译机器人”

1.1 它不是简单调用Google Translate的壳子

市面上很多Telegram翻译Bot只是把用户消息转发给第三方API,再把结果贴回来。ClawdBot完全不同:

  • 双引擎智能兜底:默认走 LibreTranslate(完全开源、可自建),自动 fallback 到 Google Translate(需配置);
  • 语音处理全程离线:接收到语音后,直接用本地 Whisper tiny 模型转写,0.5秒内出文字,再翻译,全程不联网;
  • 图片OCR不依赖云服务:使用 PaddleOCR 轻量模型,中文识别准确率超92%,英文接近98%,连手写体都能认;
  • 所有功能打包进300MB镜像:含vLLM推理服务、Whisper、PaddleOCR、翻译引擎、Web控制台,开箱即用。

小知识:ClawdBot 是 MoltBot 的增强演进版,底层仍沿用 MIT 协议,Star 数已突破2000,社区活跃,Discord/Slack适配分支已上线。

1.2 隐私与部署体验,真的“零配置”

  • 默认不记录任何聊天记录,消息处理完即销毁;
  • 可开启「阅后即焚」模式,连日志都不留;
  • 支持 SOCKS5/HTTP 代理,国内服务器也能直连 Telegram;
  • docker-compose up -d 启动后,5分钟内就能在Telegram里@bot开始用;
  • 树莓派4B(4GB内存)实测支持15人并发,CPU占用稳定在65%以下。

这不是一个需要你配Nginx、反向代理、SSL证书、JWT鉴权的“工程级项目”——它就是一个为真实使用而生的工具。

2. 三步完成部署:从空服务器到Telegram可用Bot

2.1 前置准备:确认环境与权限

你需要一台 Linux 服务器(Ubuntu 22.04 / Debian 12 推荐),并确保满足以下条件:

  • Docker ≥ 24.0,Docker Compose ≥ 2.20
  • 至少2GB内存(推荐4GB+,尤其启用多模型时)
  • 已安装 curl、jq(用于后续验证)
  • 若在国内,建议提前配置好代理(ClawdBot支持全局SOCKS5代理)

提示:不需要Python环境、不需要CUDA驱动、不需要手动下载大模型——所有模型随镜像预装。

2.2 一键拉取并启动ClawdBot

执行以下命令(无需修改任何参数,全部默认):

# 创建工作目录
mkdir -p ~/clawdbot && cd ~/clawdbot

# 下载官方docker-compose.yml(已预置vLLM + Whisper + PaddleOCR)
curl -fsSL https://raw.githubusercontent.com/moltbot/moltbot/main/docker-compose.yml -o docker-compose.yml

# 启动服务(后台运行)
docker compose up -d

# 查看启动状态(等待约45秒,直到显示"healthy")
docker compose ps

你会看到类似输出:

NAME                COMMAND                  SERVICE             STATUS              PORTS
clawdbot-gateway    "python3 -m clawdbo…"   gateway             running (healthy)   0.0.0.0:18780->18780/tcp
clawdbot-vllm       "/bin/bash -c 'ulimi…"   vllm                running (healthy)   0.0.0.0:8000->8000/tcp
clawdbot-webui      "sh -c 'cd /app && p…"   webui               running (healthy)   0.0.0.0:7860->7860/tcp

此时,vLLM推理服务、OCR模块、语音转写模块、Web控制台均已就绪。

2.3 获取Telegram Bot Token并完成绑定

ClawdBot 不会自动创建Bot,你需要先在 @BotFather 中获取自己的Token:

  1. 在Telegram中打开 @BotFather
  2. 发送 /newbot → 按提示输入名称(如 MyClawdTranslator)和用户名(如 my_clawd_bot
  3. 复制返回的Token(形如 1234567890:ABCdefGhIJKlmNoPQRstUvwXYZ

然后编辑配置文件:

# 进入容器挂载目录(ClawdBot默认映射到/app)
nano /app/clawdbot.json

找到 "channels" 区块,填入你的Token(注意保留引号):

"channels": {
  "telegram": {
    "enabled": true,
    "botToken": "1234567890:ABCdefGhIJKlmNoPQRstUvwXYZ",
    "dmPolicy": "pairing",
    "groupPolicy": "allowlist"
  }
}

保存后重启服务:

docker compose restart gateway

注意:首次启动后,ClawdBot会自动尝试连接Telegram服务器。若网络受限,请在同目录下创建 .env 文件,添加代理配置:

HTTP_PROXY=http://127.0.0.1:7890
HTTPS_PROXY=http://127.0.0.1:7890

3. 实战演示:语音/图片/汇率,三类高频需求一次讲透

3.1 语音翻译:发条语音,秒出译文

操作流程
① 在Telegram中私聊你的Bot(如 @my_clawd_bot
② 点击输入框旁的「麦克风」图标,说一段中文(例如:“今天天气不错,我们去咖啡馆坐坐吧”)
③ 发送语音 → Bot自动转写 → 自动翻译成英文 → 返回结果

效果示例

🎙 你发送语音(中文)
Bot回复:
“The weather is nice today. Let’s go sit at a café.”
—— 转写+翻译全程耗时约0.8秒,无卡顿、无延迟。

原理简析(小白友好版):
语音进来 → Whisper tiny 模型本地转成文字 → 文字交给 LibreTranslate 引擎翻译 → 结果返回Telegram。整个链路不经过任何第三方服务器,你的语音永远只存在你自己的设备上。

3.2 图片OCR翻译:拍张照,文字秒识别+翻译

操作流程
① 私聊Bot,发送一张含文字的图片(可以是菜单、说明书、手写笔记、路标)
② Bot自动调用 PaddleOCR 识别图中文字
③ 识别成功后,自动翻译为目标语言(默认为英文,可改)
④ 返回带高亮标注的原图 + 识别文本 + 翻译结果

效果示例

📸 你发送一张日文便利店价目表截图
Bot回复:

  • 原图(已用红色方框标出识别区域)
  • OCR识别文本:牛乳 200円
  • 翻译结果:Milk ¥200

小技巧

  • 发送图片时加文字说明,可引导翻译方向。例如发送图片+文字“请翻译成中文”,Bot会优先输出中文译文;
  • 支持批量处理:一次发送3张图,Bot会依次识别并返回,不排队、不丢帧。

3.3 汇率/天气/维基:不用切APP,一句话查到底

ClawdBot 内置三大快捷命令,全部免跳转、免登录、免注册:

命令 示例 说明
/fx /fx 100 USD to CNY 实时汇率查询,支持170+货币对,数据来自ECB+Fixer.io双源
/weather /weather Beijing 查询全球城市天气,含温度、湿度、风速、空气质量,数据来自OpenWeatherMap
/wiki /wiki quantum computing 返回维基百科摘要(前3段),支持中/英/日/韩等20+语言

真实交互示例

你:/fx 500 EUR to JPY
Bot:€500 ≈ ¥82,340(EUR/JPY: 164.68)|更新时间:2026-01-24 14:22:07

你:/weather Shanghai
Bot:上海 · 晴 · 18°C · 湿度52% · 风速3m/s · AQI 48(优)

你:/wiki 大模型
Bot:大模型(Large Language Model)指参数量达数十亿以上的语言模型……(中文摘要,共286字)

全部响应时间 ≤1.2秒,且所有查询结果均缓存30分钟,重复请求直接返回,不额外调用API。

4. 进阶配置:按需切换模型、调整翻译策略、启用群聊自动翻译

4.1 更换更强的翻译模型(可选)

ClawdBot 默认使用 LibreTranslate(轻量、快、离线),但你也可以接入 Google Translate 或自建 DeepL API:

编辑 /app/clawdbot.json,修改 providers 区块:

"providers": {
  "libretranslate": {
    "baseUrl": "http://localhost:5000/v1",
    "apiKey": "",
    "models": ["en", "zh", "ja", "ko", "fr", "de", "es"]
  },
  "google": {
    "baseUrl": "https://translation.googleapis.com/language/translate/v2",
    "apiKey": "YOUR_GOOGLE_API_KEY",
    "models": ["en", "zh", "ja", "ko", "fr", "de", "es"]
  }
}

提示:Google API需开通Cloud Translation API服务,并设置配额。ClawdBot会在LibreTranslate失败时自动fallback到Google。

4.2 开启群聊自动翻译(谨慎启用)

默认ClawdBot仅响应私聊和@bot提及。如需在群聊中自动翻译(例如技术群每日外文资讯),请修改配置:

"channels": {
  "telegram": {
    "enabled": true,
    "botToken": "...",
    "groupPolicy": "auto-translate",  // ← 改为此值
    "autoTranslateLanguages": ["en", "ja", "ko"], // 仅翻译这些语言
    "targetLanguage": "zh"            // 统一译为中文
  }
}

注意:

  • 开启后,Bot会监听群内所有消息(除被屏蔽用户外);
  • 建议先在小群测试,避免误触发;
  • 可通过 /stop 命令临时关闭当前群自动翻译。

4.3 Web控制台:图形化管理一切

ClawdBot 内置 Gradio Web UI,地址为 http://你的服务器IP:7860(首次访问需token):

# 获取带token的访问链接
clawdbot dashboard

输出示例:

Dashboard URL: http://127.0.0.1:7860/?token=23588143fd1588692851f6cbe9218ec6b874bb859e775762
Then open from your computer:
ssh -N -L 7860:127.0.0.1:7860 user@your-server-ip

进入后,你可:

  • 实时查看各模块健康状态(vLLM、OCR、Whisper)
  • 在「Config」→「Models」中切换主模型(如换成 Qwen3-4B-Instruct)
  • 在「Logs」中筛选错误日志(按channel、level、time)
  • 在「Devices」中批准新设备授权(如你用手机端Telegram登录)

小技巧:UI右上角有「Export Config」按钮,一键导出当前全部配置,方便备份或迁移。

5. 故障排查:90%的问题,三行命令解决

5.1 Bot不回复?先查这三件事

现象 快速诊断命令 常见原因 解决方案
完全无响应 docker compose logs gateway | grep -i "error|fail" Telegram连接失败 检查 botToken 是否正确;确认代理配置;运行 clawdbot channels status --probe
语音不转写 docker compose logs vllm | grep whisper Whisper服务未加载 重启 docker compose restart vllm;检查 /app/models/whisper-tiny 是否存在
图片不识别 docker compose logs gateway | grep ocr PaddleOCR模型路径错误 进入容器 docker exec -it clawdbot-gateway bash,运行 paddleocr --version 验证

5.2 常见报错与修复

  • Gateway not reachable: Error: gateway closed (1006)
    → 表示 gateway 容器崩溃。执行 docker compose restart gateway,再检查 /app/clawdbot.jsonchannels.telegram.enabled 是否为 true

  • Model not found: vllm/Qwen3-4B-Instruct-2507
    → 模型未加载成功。运行 clawdbot models list,若无输出,说明 vLLM 服务异常,执行 docker compose restart vllm

  • Web UI打不开,提示 token 错误
    → token 有时效(默认24小时)。重新运行 clawdbot dashboard 获取新链接,或在浏览器中清除本地存储。

6. 总结:一个真正属于你的AI翻译官,现在就能用

ClawdBot 不是一个概念Demo,也不是一个需要你花三天调参的实验项目。它是一套已经打磨成熟的、面向真实使用场景的工具链:

  • 语音翻译:说中文,出英文,Whisper tiny本地跑,0.8秒响应;
  • 图片翻译:拍菜单、扫说明书、识手写,PaddleOCR离线识别,准确率超92%;
  • 汇率天气维基/fx /weather /wiki 三条命令,覆盖日常80%信息查询需求;
  • 隐私可控:默认不存记录,支持阅后即焚,消息不出你家服务器;
  • 部署极简docker compose up -d 启动,5分钟上线,树莓派4B也能扛住;
  • 开源可商用:MIT协议,2000+ Star,社区持续维护,文档齐全。

它不会取代专业翻译,但能让你在跨国协作、旅行、学习、购物中,少点焦虑,多点效率。更重要的是——你拥有它,而不是被某个平台“租用”。

现在,就打开终端,敲下那条 docker compose up -d 吧。5分钟后,你的Telegram里,将多一位永远在线、永不收费、绝不泄露隐私的AI翻译官。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐