
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本篇主要是记录下自己所了解到的小智AI聊天机器人背后的语音技术的后半部分(`声纹识别 3D Speaker + 大模型 TTS - 火山引擎 + 大模型TTS - CosyVoice`)。

本篇主要是记录下自己所了解到的小智AI聊天机器人背后的语音技术的一部分(`ESP-SR+SenseVoice`),这块内容有点多所以估计要拆成几篇去记录了。

最近在机器人产品中经常接触到485,所以就想着系统的梳理下,方便后续的查看和回顾以及对自己不懂的地方进行查漏补缺。本篇属于学习笔记记录

本篇主要是记录下自己所了解到的小智AI聊天机器人背后的语音技术的后半部分(`声纹识别 3D Speaker + 大模型 TTS - 火山引擎 + 大模型TTS - CosyVoice`)。

分享如何安装和使用非常强大的编程助手Cline

本篇主要是梳理和记录与语音相关功能的整体代码框架是怎么样的,有哪些模块它们又分别起到什么作用,先对与语音相关的整体代码结构有个初步的了解,这部分内容也比较多所以会分开来记录。

介绍小智AI机器人的代码框架2,主要介绍main目录下的一些核心应用文件的功能和其设计逻辑

由于后续的工作要接触摄像头开发,因此这里需要提前了解些视频编解码相关的知识,以及视频相关的业务。但是工作至今由于没怎么接触过视频编解码,因此对于视频编解码中的很多东西都不是很清楚,也不知道该从哪里去学。这里主要记录下从各方渠道了解到的一些视频编解码的基本概念,让自己和大家对视频编解码先有个初步的认识。本文比较适合像我这种粗略了解过视频编解码技术的小白,另外这是一个学习记录文章,该文章中的很多内容借

本篇主要是记录下自己所了解到的小智AI聊天机器人背后的语音技术的后半部分(`声纹识别 3D Speaker + 大模型 TTS - 火山引擎 + 大模型TTS - CosyVoice`)。

本篇主要是梳理和记录与语音相关功能的整体代码框架是怎么样的,有哪些模块它们又分别起到什么作用,先对与语音相关的整体代码结构有个初步的了解,这部分内容也比较多所以会分开来记录。








