logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音助手如何接入MCP

本文提供了一个快速接入MCP(Multi-Channel Processing)的Python实现方案,包含精简的Server和Client示例代码。通过5个简单步骤:1)安装环境;2)编写Server端代码;3)测试Server;4)编写Client端代码;5)运行Client测试。文中展示了两个基础功能(add和greet)的实现,并演示了如何调用工具和获取结果。最后提到可以将Server集成

文章图片
#人工智能#语音识别
从零搭建你的语音助手系列 | 系列总览

《从零打造个性化AI语音助手实践记录》作者分享了自己用树莓派5+Python+本地AI模型构建数字助手的全过程。该项目不同于普通功能堆砌,旨在创造真正理解用户、有温度的AI伙伴。内容涵盖硬件搭建、UI设计、语音交互(声纹识别/TTS)、任务调度、家庭自动化等核心模块,并持续更新。作者从机器人动画获取灵感,将陆续开源项目代码,欢迎开发者关注交流。项目地址:https://github.com/gdh

文章图片
#人工智能
小白也能懂!avahi-daemon 带你玩转局域网免配置访问

avahi-daemon是Linux系统提供的mDNS/DNS-SD服务,可实现局域网设备免配置自动发现。它通过Zeroconf协议自动广播设备信息,让用户通过设备名.local(如raspberrypi.local)直接访问,无需记忆IP地址。该工具特别适合树莓派、NAS等设备在家庭/办公网络中使用,大幅简化了SSH连接、文件共享等操作。作者展示了如何通过该服务实现跨网络环境访问树莓派,并在Ma

文章图片
#语音识别#人工智能
MCP和语音助手有什么关系

MCP协议为AI系统提供了标准化接口,实现大模型与外部工具/数据源的即插即用交互。

文章图片
#人工智能
语音助手如何理解图片

摘要:文章介绍了语音助手Franky如何通过图像识别技术实现"看图说话"功能。其核心技术包括三步:选取最新图片、转换为Base64格式、调用阿里云多模态大模型Qwen-VL进行分析。该技术可应用于儿童绘画讲解、饮食健康分析等场景,让语音助手不仅能听还能"看",实现更自然的人机交互。文章还展望了未来可能的拓展应用方向,强调AI理解视觉信息对提升用户体验的重要性

文章图片
#语音识别#人工智能
如何使用gitee作为免费图床

Use Gitee as public pictures storage本篇文章是一个启发,介绍如何使用gitee作为免费图床。没有使用github的原因是因为github国内访问有些慢。另外,还有其他优秀的云存储,例如7niu,朋友们也可以试一下。

#git
到底了