3月8日重磅更新:OpenClaw Talk 模式实战指南:如何配置语音通话
OpenClaw Talk 模式实战指南介绍了如何配置AI语音通话功能。该功能支持电话接听、双向语音对话、智能响应,并需配置电话渠道(如Twilio)、TTS语音合成(推荐硅基流动或ElevenLabs)和STT语音识别(默认OpenAI Whisper)。配置步骤包括安装插件、设置电话服务、选择TTS/STT服务及AI模型,并提供了完整JSON配置示例。国内用户推荐使用硅基流动TTS,支持多种音
·
3月8日重磅更新:OpenClaw Talk 模式实战指南:如何配置语音通话
OpenClaw 的 Talk 模式让 AI 能够通过电话与你实时对话。本文将详细介绍 Talk 模式是什么、如何配置、以及如何解决第三方 TTS 服务的兼容性问题。
一、Talk 模式是什么?
Talk 模式是 OpenClaw 的语音通话功能,允许 AI Agent 通过电话与用户进行实时语音对话。
核心能力
- 📞 来电接听:AI 可以接听用户来电
- 🗣️ 语音对话:支持双向语音交流
- 🤖 AI 智能响应:基于大模型的智能对话
- 🎙️ TTS 语音合成:将文本转换为语音播放给用户
- 🎧 STT 语音识别:将用户语音转换为文字
二、Talk 模式工作原理
用户打电话 → Twilio/Telnyx/Plivo → OpenClaw 接收 →
用户说话 → STT(语音转文字)→ AI 处理 →
AI 回复 → TTS(文字转语音)→ 播放给用户 → 挂断
需要的组件
| 组件 | 作用 | 必须 |
|---|---|---|
| 电话渠道 | 接听/拨打电话 | ✅ |
| TTS | 文字转语音 | ✅ |
| STT | 语音转文字 | ✅ |
三、支持的平台
电话服务提供商
| 提供商 | 特点 | 支持地区 |
|---|---|---|
| Twilio | 最流行,文档完善 | 全球 |
| Telnyx | 价格实惠 | 北美/欧洲 |
| Plivo | 新兴选择 | 全球 |
| Mock | 开发测试用 | 本地 |
TTS 语音服务
| 提供商 | 特点 | 免费额度 |
|---|---|---|
| ElevenLabs | 高质量,多语言 | 10,000 字符/月AI TTS** |
| **Open 有免费额度 | ||
| Edge TTS | 微软技术 | 完全免费 |
| 硅基流动 | 国内快,多模型 | 按量计费 |
四、完整配置教程
第一步:安装 Voice Call 插件
# 安装插件
openclaw plugins install @openclaw/voice-call
# 重启 Gateway
openclaw gateway restart
第二步:配置电话渠道(Twilio 为例)
- 注册 Twilio 账号:https://www.twilio.com
- 购买电话号码:在 Twilio 控制台购买一个电话号码
- 配置 Webhook:设置来电时访问的 URL
OpenClaw 配置:
{
"plugins": {
"entries": {
"voice-call": {
"enabled": true,
"config": {
"provider": "twilio",
"fromNumber": "+15551234567",
"twilio": {
"accountSid": "ACxxxxxxxxxxxxx",
"authToken": "your_auth_token"
},
"serve": {
"port": 3334,
"bind": "0.0.0.0"
}
}
}
}
}
}
配置说明:
provider:电话服务商(twilio/telnyx/plivo)fromNumber:你的 Twilio 电话号码(E.164 格式)twilio.accountSid:Twilio 账号 SIDtwilio.authToken:Twilio Auth Tokenserve.port:Web 服务端口(默认 3334)
第三步:配置 TTS 语音合成
方案 A:硅基流动(国内用户推荐)
{
"messages": {
"tts": {
"openai": {
"apiKey": "YOUR_SILICONFLOW_KEY",
"baseUrl": "https://api.siliconflow.cn/v1",
"model": "fnlp/MOSS-TTSD-v0.5",
"voice": "fnlp/MOSS-TTSD-v0.5:alex"
}
}
}
}
方案 B:ElevenLabs(国际用户推荐)
{
"messages": {
"tts": {
"elevenlabs": {
"apiKey": "YOUR_ELEVENLABS_KEY",
"voiceId": "your_voice_id"
}
}
}
}
方案 C:OpenAI TTS
{
"messages": {
"tts": {
"openai": {
"apiKey": "sk-xxx",
"model": "tts-1",
"voice": "alloy"
}
}
}
}
第四步:配置 STT 语音识别
STT 默认使用 OpenAI Whisper,无需额外配置:
{
"messages": {
"stt": {
"provider": "openai",
"openai": {
"apiKey": "YOUR_OPENAI_KEY"
}
}
}
}
第五步:配置 AI 模型
{
"plugins": {
"entries": {
"voice-call": {
"config": {
"responseModel": "openai/gpt-4o-mini",
"responseSystemPrompt": "你是一个友好的 AI 助手,请用简洁的语言回答问题。"
}
}
}
}
}
第六步:配置端口映射(如果需要公网访问)
{
"plugins": {
"entries": {
"voice-call": {
"config": {
"tunnel": {
"provider": "ngrok",
"ngrokAuthToken": "YOUR_NGROK_TOKEN"
}
}
}
}
}
}
五、硅基流动 TTS 详解
格式解释
fnlp/MOSS-TTSD-v0.5:alex 含义:
| 部分 | 含义 | 示例 |
|---|---|---|
| 冒号前 | 模型名称 | fnlp/MOSS-TTSD-v0.5 |
| 冒号后 | 音色名称 | alex |
可用模型
| 模型 | 特点 |
|---|---|
| fnlp/MOSS-TTSD-v0.5 | 双人对话,中英双语,低延迟 |
| FunAudioLLM/CosyVoice2-0.5B | 跨语言,情感控制 |
| fishaudio/fish-speech-1.5 | 语音克隆(需参考音频) |
可用音色
| 类型 | 音色 | 特点 |
|---|---|---|
| 男声 | alex | 沉稳 |
| 男声 | benjamin | 低沉 |
| 男声 | charles | 磁性 |
| 男声 | david | 欢快 |
| 女声 | anna | 沉稳 |
| 女声 | bella | 激情 |
| 女声 | claire | 温柔 |
| 女声 | diana | 欢快 |
完整配置示例
{
"plugins": {
"entries": {
"voice-call": {
"enabled": true,
"config": {
"provider": "twilio",
"fromNumber": "+15551234567",
"twilio": {
"accountSid": "ACxxx",
"authToken": "xxx"
},
"responseModel": "openai/gpt-4o-mini",
"responseSystemPrompt": "你是一个友好的 AI 助手。"
}
}
}
},
"messages": {
"tts": {
"openai": {
"apiKey": "YOUR_SILICONFLOW_KEY",
"baseUrl": "https://api.siliconflow.cn/v1",
"model": "fnlp/MOSS-TTSD-v0.5",
"voice": "fnlp/MOSS-TTSD-v0.5:alex"
}
},
"stt": {
"provider": "openai"
}
}
}
测试 TTS
# 测试硅基流动 TTS
curl -s https://api.siliconflow.cn/v1/audio/speech \
-H "Authorization: Bearer YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "fnlp/MOSS-TTSD-v0.5",
"input": "你好,我是 AI 助手",
"voice": "fnlp/MOSS-TTSD-v0.5:alex",
"response_format": "mp3"
}' --output test.mp3
# 验证
ls -lh test.mp3
file test.mp3
六、常见问题
Q1: IndexTTS-2 可以用吗?
答:暂时不可以。IndexTTS-2 需要用户上传参考音频才能使用,目前 API 不支持直接调用。
可用替代:
- fnlp/MOSS-TTSD-v0.5 ✅
- FunAudioLLM/CosyVoice2-0.5B ✅
Q2: 配置好就能用了吗?
答:还需要:
- 将 Twilio 的 Webhook URL 配置为你的 OpenClaw 公网地址
- 确保防火墙开放对应端口
Q3: 国内访问速度慢怎么办?
答:使用硅基流动 TTS + 国内服务器部署 OpenClaw
七、总结
- Talk 模式需要:电话渠道 + TTS + STT + AI 模型
- 电话渠道:Twilio/Telnyx/Plivo
- TTS 推荐:硅基流动(国内快、便宜)
- 配置简单:只需在配置文件中添加相应参数
- IndexTTS-2:暂不支持,需要参考音频
配置检查清单
- 安装 Voice Call 插件
- 注册 Twilio/Telnyx/Plivo 账号
- 购买电话号码
- 配置 TTS(推荐硅基流动)
- 配置 STT(默认 OpenAI)
- 配置 AI 模型
- 配置端口映射(如需公网)
- 重启 Gateway
- 测试电话接入
相关资源
- OpenClaw 官方文档:https://docs.openclaw.ai
- Voice Call 插件文档:https://docs.openclaw.ai/plugins/voice-call
- 硅基流动:https://www.siliconflow.cn
- Twilio:https://www.twilio.com
标签:OpenClaw、Talk 模式、Voice Call、TTS、语音合成、硅基流动、Twilio
发布日期:2026-03-10
更多推荐

所有评论(0)