logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于ESP32-S3-BOX-Lite的语音合成与播报系统(esp-idf+WiFi+HTTPS+TTS)

本项目基于ESP32-S3-BOX-Lite,使用 esp-idf 开发,连接 WiFi 并发出 HTTPS 请求,得到B站用户数据的返回信息,再使用 cJSON 完成 json 数据解析,最后通过乐鑫的 TTS 实现语音合成与播报。

文章图片
基于音乐识别的频谱转换算法——常数Q变换CQT(转载修改)

傅立叶变换的缺点由于在音乐中,所有的音都是由若干八度的12平均律共同组成的,这十二平均律对应着钢琴中一个八度上的十二个半音。这些半音临近之间频率比为21/12。显然,同一音级的两个八度音,高八度音是低八度音频率的两倍。因此在音乐当中,声音都是以指数分布的,但我们的傅立叶变换得到的音频谱都是线性分布的,两者的频率点是不能一一对应的,这会指使某些音阶频率的估计值产生误差。所以现代对音乐声音的分析,..

#傅立叶分析#语音识别
论文精翻《Progressive Tandem Learning for Pattern Recognition With Deep Spiking Neural Networks》

脉冲神经网络(SNNs)由于其事件驱动和稀疏通信的特性,在低延迟和高计算效率方面比传统人工神经网络(ANN)显示出明显的优势。然而,深度SNN的训练并不简单。在本文中,我们提出了一种新的ANN-to-SNN转换和分层学习框架,用于快速有效的模式识别,称为渐进串联学习。通过研究ANN和SNN在离散表示空间中的等价性,引入了一种原始网络转换方法,充分利用脉冲计数来近似ANN神经元的激活值。为了补偿由原

文章图片
#人工智能#深度学习
到底了