logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

测评|手机本地AI Agent接管通话,不依赖云服务,MCP协议这套路我测了3天

本文介绍了如何利用Anthropic开源的MCP协议实现本地AI直接控制手机硬件功能。通过Termux+Node.js环境搭建MCPServer,使AI能完成拨号、短信、拍照等18项手机操作,且数据全程本地处理。实测显示,AI可自然语言拨号(2-3秒响应),通话后自动生成摘要并发送短信提醒。方案优势在于隐私保护(不上传云端)、断网可用和跨平台兼容,但存在安卓限定、需局域网连接等技术门槛。让AI能真

文章图片
Android应用app实现AI电话机器人接打电话

我们在手机厂商的AI通话的功能之外,拓展了一种不受手机厂商和定制安卓限制的方式,为社会上公共的开发人员提供了一种基于普通Android应用app级别的AI电话机器人的应用能力。上层app可以使用底层内置SDK,很容易的就可以对手机电话外呼和来电过程的通话声音进行提取和加工处理。上层app在这个基础之上可以自由的定制更多的电话的IVR语音导航和AI通话的相关功能,自由的接入DeepSeek等各种AI

文章图片
#android#人工智能#机器人
避坑|虚拟小号一投诉就团灭?试试手机卡

文章摘要:朋友公司因两个号码被投诉导致整个外呼系统被运营商关停,损失惨重。作者建议改用手机SIM卡方案,通过SIP协议对接CRM系统,实现自主控制外呼线路。相比虚拟中继线路,手机卡方案成本更低(无押金、月租低)、风险更可控(单卡被封不影响整体业务)、接通率更高(40-60%)。虽然存在并发量低、需技术配置等缺点,但对每日几百通电话的小团队更安全可靠。文末提供SIP对接和AI切换的配置文档,助力企业

文章图片
蓝牙电话方案-如何对接WebRTC的实时媒体流-技术预研

本文探讨了蓝牙电话方案在外呼机器人应用中面临的技术选型问题。当前主流方案采用SIP协议传输通话数据和状态,但市面AI机器人多优先使用WebRTC(通过WebSocket连接)。研究对比了两种现有传输方式(局域网TCP/UDP和SIP+RTP)与WebRTC的差异,重点分析了是否需兼容WebRTC接口。作者提出两个潜在方案:手机APP直连WebRTC或通过FreeSWITCH模块中转,但指出AI机器

文章图片
#webrtc#媒体
测评|手机本地AI Agent接管通话,不依赖云服务,MCP协议这套路我测了3天

本文介绍了如何利用Anthropic开源的MCP协议实现本地AI直接控制手机硬件功能。通过Termux+Node.js环境搭建MCPServer,使AI能完成拨号、短信、拍照等18项手机操作,且数据全程本地处理。实测显示,AI可自然语言拨号(2-3秒响应),通话后自动生成摘要并发送短信提醒。方案优势在于隐私保护(不上传云端)、断网可用和跨平台兼容,但存在安卓限定、需局域网连接等技术门槛。让AI能真

文章图片
测评|手机本地AI Agent接管通话,不依赖云服务,MCP协议这套路我测了3天

本文介绍了如何利用Anthropic开源的MCP协议实现本地AI直接控制手机硬件功能。通过Termux+Node.js环境搭建MCPServer,使AI能完成拨号、短信、拍照等18项手机操作,且数据全程本地处理。实测显示,AI可自然语言拨号(2-3秒响应),通话后自动生成摘要并发送短信提醒。方案优势在于隐私保护(不上传云端)、断网可用和跨平台兼容,但存在安卓限定、需局域网连接等技术门槛。让AI能真

文章图片
做自己的小爱通话-AI手机电话外呼-从手机ivr应答走向手机ai应答

本篇章中,我们重要探讨如何将提取到的手机电话语音,通过预先部署的AI机器人平台,实现一个自定义的“AI电话手机”/“AI电话外呼工作手机”的能力。通常来说websocket直连的方式能让手机打电话时“端到端”时延更少,通话对方听到的语音交互响应更加快速。而SIP协议对接的方式在多个手机网关并发数高的时候能够有更加灵活的扩展方式,话术和业务调度的并发协同性会更好。

文章图片
#人工智能#语音识别
Android手机变SIP网关三大核心技术突破

摘要:将Android手机改造为SIP网关需突破三大关键技术:1)融合Android原生与蓝牙HFP协议实现事件捕获与协议转换,解决双卡支持和通话状态监测问题;2)利用蓝牙SCO链路实现语音流拦截与转发,建立手机通话与SIP RTP流之间的音频通道;3)采用"一卡一SIP账户"模型实现多SIM卡管理与SIP会话映射,使双卡手机可同时作为两条独立SIP中继线路。这些技术突破使消费

文章图片
#android
AI外呼手机SIM卡拨号技术实现

摘要:AI外呼手机通过SIM卡实现智能外呼,需整合蓝牙HFP协议、Android系统API及AI语音处理技术。核心方案包括:1)利用蓝牙配件捕获通话音频和信令;2)通过UDP/TCP传输音频至AI服务器进行实时语音识别与合成;3)集成SIP协议对接企业呼叫中心系统。该技术需解决双卡支持、后台保活等挑战,适用于合规的AI电话机器人、混合呼叫中心等场景,实现低成本、灵活的外呼功能。技术关键在于绕过An

文章图片
#人工智能
手机打电话时由对方DTMF响应切换多级IVR语音应答(一)

在本篇及后面的几篇,我们将针对多级IVR语音导航的功能,规划出一个可用的界面及操作App出来,使同一个用户,名下所有的手机,都能使用同一套多级IVR语音来进行单机化的部署。(会不会把它引导到云平台上,然后用多并发的方式来实现更加容易?但这个不是本次主题讨论的范畴,我们默认就已经具备了这个云平台功能,本次只讨论单机版)

文章图片
#语音识别#人工智能
    共 16 条
  • 1
  • 2
  • 请选择