aig8440 个人主页

@aig8440

aig8440

2024-02-22 10:03:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

音频重采样

对于采样率为Fs，长度为M个采样点的音频信号x[n]，，通过采样因子P/Q进行重采样后，这个信号的样本数可以增大或者减小。该过程可以分为如下三个步骤[17]：(1)上采样：在原信号相邻两点内插入P-1个零点，即创建一个有P (M-1)+1个采样点的信号xu[n]，当n=1，2，…，M时，xu[P(n-1)+1] =x[n]；否则，xu[n]=0。(2)插值：xu[n]和一个低通...

低质量音频伪装高质量音频的检测方法

这里有篇论文《基于子带谱平滑度的音频篡改检测》，可供参考。这里的质量主要涉及到采样率，即低采样率伪装高采样率音频。大部分假无损就是上采样为高质量的音频，然后用无损格式封装。11025Hz 伪装重采样 22050Hz音频，重采样不会补充有用信息，即11025/2 ~ 22050/2仍然平坦。22050Hz原始音频，一般情况下是自然逐步衰减(这取决与音频的内容，也有例外)...

Praat 音频分析人工标注

http://pan.baidu.com/s/1o6BdE5c转载于:https://www.cnblogs.com/welen/p/3781965.html

音频DAC剖析---解开HI-FI音质的秘密

选自：http://mp3.zol.com.cn/54/547689.html　　无论我们是买MP3、MP4也好，实际上我们的数码播放器最经常使用的就是音乐播放功能，所以数码播放器的音质，一直是消费者的重点关注对象。　　什么是音频DAC?　　之前，大家普遍认为决定音质的关键是主控解码芯片，这种说法基本正确，但不够精确。事实上，决定MP3音质的关键是主控解码芯片里面的...

神经网络的BP算法

正向传播：W下脚标定义根据用户自己的习惯反向传播算法1.误差由本层传到上层相关联的结点，权重分配2.上层某个结点的总误差2.误差最小化与权重变量有关，最小梯度法。权重因子更新偏导数求解，链式求导法则：误差由本层逐层向上层推...

#人工智能

OLA音频变速算法的仿真与剖析

前段时间，在尝试音乐节拍数的提取时，终于有了突破性的进展，效果基本上比市面上的许多商业软件还要好，在作节拍数检测时，高频信息作用不大，通过重采样减小运算量。重采样让我想起了在学校里面做的变速变调算法，在这里顺便回顾一下。OLA(Overlap-and-Add, OLA)重叠叠加算法是音频变速算法中最简单的时域方法，它是后续时域算法(SOLA, SOLA-F...

#人工智能

深度学习语音降噪总结

　　实时语音通信发展到今天，用户对通话语音质量提出了越来越高的要求。由于终端设备的多样性以及使用场景的差异，声音问题依然存在。传统的音频处理技术从声音信号本身出发，挖掘其时频特性，作出假设，建立物理模型，很多参数都需要人工进行精细化微调，比较费时费力。随着AI技术的发展，凭借着其强大的拟合能力，利用数据驱动，为改善音频体验提供了更多的可能性。关于理论部分，包括论文有很...

#人工智能 #matlab

[转]Kaldi语音识别

转：http://ftli.farbox.com/post/kaldizhong-wen-shi-bieKaldi语音识别1.声学建模单元的选择1.1对声学建模单元加入位置信息2.输入特征3.区分性技术4.多音字如何处理？5.Noise Robust ASR 6.Deep Learning[DNN/CNN替换GMM]7.在手机等资源受限设备a...

#人工智能

语音识别概述

后验概率最大，即为判别结果HTK Hvite解码器Sphinx解码器 TODE解码器，生硬，修改繁琐。WFST 扩充，简单高效。有限状态机模型被用于大词汇量连续中文语音识别系统中。其操作思路是将传统语音识别系统中的数学模型，分别转换成有限状态机模型，再将转换后的模型进行有效地整合及优化，得到搜索空间。有限状态自动机（Finite-state Aut...

#人工智能

[转]Kaldi语音识别

#人工智能

共 16 条

请选择