3月8日重磅更新:OpenClaw Talk 模式实战指南:如何配置语音通话

OpenClaw 的 Talk 模式让 AI 能够通过电话与你实时对话。本文将详细介绍 Talk 模式是什么、如何配置、以及如何解决第三方 TTS 服务的兼容性问题。

一、Talk 模式是什么?

Talk 模式是 OpenClaw 的语音通话功能,允许 AI Agent 通过电话与用户进行实时语音对话。

核心能力

  • 📞 来电接听:AI 可以接听用户来电
  • 🗣️ 语音对话:支持双向语音交流
  • 🤖 AI 智能响应:基于大模型的智能对话
  • 🎙️ TTS 语音合成:将文本转换为语音播放给用户
  • 🎧 STT 语音识别:将用户语音转换为文字

二、Talk 模式工作原理

用户打电话 → Twilio/Telnyx/Plivo → OpenClaw 接收 → 
用户说话 → STT(语音转文字)→ AI 处理 → 
AI 回复 → TTS(文字转语音)→ 播放给用户 → 挂断

需要的组件

组件 作用 必须
电话渠道 接听/拨打电话
TTS 文字转语音
STT 语音转文字

三、支持的平台

电话服务提供商

提供商 特点 支持地区
Twilio 最流行,文档完善 全球
Telnyx 价格实惠 北美/欧洲
Plivo 新兴选择 全球
Mock 开发测试用 本地

TTS 语音服务

提供商 特点 免费额度
ElevenLabs 高质量,多语言 10,000 字符/月AI TTS**
**Open 有免费额度
Edge TTS 微软技术 完全免费
硅基流动 国内快,多模型 按量计费

四、完整配置教程

第一步:安装 Voice Call 插件

# 安装插件
openclaw plugins install @openclaw/voice-call

# 重启 Gateway
openclaw gateway restart

第二步:配置电话渠道(Twilio 为例)

  1. 注册 Twilio 账号:https://www.twilio.com
  2. 购买电话号码:在 Twilio 控制台购买一个电话号码
  3. 配置 Webhook:设置来电时访问的 URL

OpenClaw 配置

{
  "plugins": {
    "entries": {
      "voice-call": {
        "enabled": true,
        "config": {
          "provider": "twilio",
          "fromNumber": "+15551234567",
          "twilio": {
            "accountSid": "ACxxxxxxxxxxxxx",
            "authToken": "your_auth_token"
          },
          "serve": {
            "port": 3334,
            "bind": "0.0.0.0"
          }
        }
      }
    }
  }
}

配置说明

  • provider:电话服务商(twilio/telnyx/plivo)
  • fromNumber:你的 Twilio 电话号码(E.164 格式)
  • twilio.accountSid:Twilio 账号 SID
  • twilio.authToken:Twilio Auth Token
  • serve.port:Web 服务端口(默认 3334)

第三步:配置 TTS 语音合成

方案 A:硅基流动(国内用户推荐)
{
  "messages": {
    "tts": {
      "openai": {
        "apiKey": "YOUR_SILICONFLOW_KEY",
        "baseUrl": "https://api.siliconflow.cn/v1",
        "model": "fnlp/MOSS-TTSD-v0.5",
        "voice": "fnlp/MOSS-TTSD-v0.5:alex"
      }
    }
  }
}
方案 B:ElevenLabs(国际用户推荐)
{
  "messages": {
    "tts": {
      "elevenlabs": {
        "apiKey": "YOUR_ELEVENLABS_KEY",
        "voiceId": "your_voice_id"
      }
    }
  }
}
方案 C:OpenAI TTS
{
  "messages": {
    "tts": {
      "openai": {
        "apiKey": "sk-xxx",
        "model": "tts-1",
        "voice": "alloy"
      }
    }
  }
}

第四步:配置 STT 语音识别

STT 默认使用 OpenAI Whisper,无需额外配置:

{
  "messages": {
    "stt": {
      "provider": "openai",
      "openai": {
        "apiKey": "YOUR_OPENAI_KEY"
      }
    }
  }
}

第五步:配置 AI 模型

{
  "plugins": {
    "entries": {
      "voice-call": {
        "config": {
          "responseModel": "openai/gpt-4o-mini",
          "responseSystemPrompt": "你是一个友好的 AI 助手,请用简洁的语言回答问题。"
        }
      }
    }
  }
}

第六步:配置端口映射(如果需要公网访问)

{
  "plugins": {
    "entries": {
      "voice-call": {
        "config": {
          "tunnel": {
            "provider": "ngrok",
            "ngrokAuthToken": "YOUR_NGROK_TOKEN"
          }
        }
      }
    }
  }
}

五、硅基流动 TTS 详解

格式解释

fnlp/MOSS-TTSD-v0.5:alex 含义:

部分 含义 示例
冒号前 模型名称 fnlp/MOSS-TTSD-v0.5
冒号后 音色名称 alex

可用模型

模型 特点
fnlp/MOSS-TTSD-v0.5 双人对话,中英双语,低延迟
FunAudioLLM/CosyVoice2-0.5B 跨语言,情感控制
fishaudio/fish-speech-1.5 语音克隆(需参考音频)

可用音色

类型 音色 特点
男声 alex 沉稳
男声 benjamin 低沉
男声 charles 磁性
男声 david 欢快
女声 anna 沉稳
女声 bella 激情
女声 claire 温柔
女声 diana 欢快

完整配置示例

{
  "plugins": {
    "entries": {
      "voice-call": {
        "enabled": true,
        "config": {
          "provider": "twilio",
          "fromNumber": "+15551234567",
          "twilio": {
            "accountSid": "ACxxx",
            "authToken": "xxx"
          },
          "responseModel": "openai/gpt-4o-mini",
          "responseSystemPrompt": "你是一个友好的 AI 助手。"
        }
      }
    }
  },
  "messages": {
    "tts": {
      "openai": {
        "apiKey": "YOUR_SILICONFLOW_KEY",
        "baseUrl": "https://api.siliconflow.cn/v1",
        "model": "fnlp/MOSS-TTSD-v0.5",
        "voice": "fnlp/MOSS-TTSD-v0.5:alex"
      }
    },
    "stt": {
      "provider": "openai"
    }
  }
}

测试 TTS

# 测试硅基流动 TTS
curl -s https://api.siliconflow.cn/v1/audio/speech \
  -H "Authorization: Bearer YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "fnlp/MOSS-TTSD-v0.5",
    "input": "你好,我是 AI 助手",
    "voice": "fnlp/MOSS-TTSD-v0.5:alex",
    "response_format": "mp3"
  }' --output test.mp3

# 验证
ls -lh test.mp3
file test.mp3

六、常见问题

Q1: IndexTTS-2 可以用吗?

:暂时不可以。IndexTTS-2 需要用户上传参考音频才能使用,目前 API 不支持直接调用。

可用替代

  • fnlp/MOSS-TTSD-v0.5 ✅
  • FunAudioLLM/CosyVoice2-0.5B ✅

Q2: 配置好就能用了吗?

:还需要:

  1. 将 Twilio 的 Webhook URL 配置为你的 OpenClaw 公网地址
  2. 确保防火墙开放对应端口

Q3: 国内访问速度慢怎么办?

:使用硅基流动 TTS + 国内服务器部署 OpenClaw


七、总结

  1. Talk 模式需要:电话渠道 + TTS + STT + AI 模型
  2. 电话渠道:Twilio/Telnyx/Plivo
  3. TTS 推荐:硅基流动(国内快、便宜)
  4. 配置简单:只需在配置文件中添加相应参数
  5. IndexTTS-2:暂不支持,需要参考音频

配置检查清单

  • 安装 Voice Call 插件
  • 注册 Twilio/Telnyx/Plivo 账号
  • 购买电话号码
  • 配置 TTS(推荐硅基流动)
  • 配置 STT(默认 OpenAI)
  • 配置 AI 模型
  • 配置端口映射(如需公网)
  • 重启 Gateway
  • 测试电话接入

相关资源

  • OpenClaw 官方文档:https://docs.openclaw.ai
  • Voice Call 插件文档:https://docs.openclaw.ai/plugins/voice-call
  • 硅基流动:https://www.siliconflow.cn
  • Twilio:https://www.twilio.com

标签:OpenClaw、Talk 模式、Voice Call、TTS、语音合成、硅基流动、Twilio

发布日期:2026-03-10

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐