简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在语音增强、语音合成、语音转换、声音转换、语音克隆、语音修复等等领域,常常要对输出的语音进行评价。对语音的质量评价一般关注两个方面,即主观评价和客观评价。主观评价就是人凭借听觉感受对语音进行打分,客观评价比较广泛,有的是通过计算输出语音与目标语音之间的声学参数之间的差异来衡量输出语音的质量;有的是依靠仪器测试响度、频率响应、灵敏度等指标;有的依靠模型和算法,模拟人工打分。注:这些评价方法并不都是相
Diffusion model
什么是语谱图什么是语谱图?最通常的,就是语音短时傅里叶变换STFT的幅度画出的2D图。之所以是通常的,是因为可以不是傅里叶变换。STFT时横轴时间,纵轴频率,每格颜色深浅代表信号能量功率大小。窄带语谱图“窄带”,顾名思义,频率带宽小,短时窗长,窄带语谱图就是长窗条件下画出的语谱图。窄带语谱图的带宽窄,那么在频率上就“分得开,更细致”,即能将语音各次谐波“看得很清楚”,即表现为“横线”。“横”就体现
scipy滤波器
倍频程,又称倍波程,指在滤波特性曲线上,频率或波长之比为2或1/2的两个频率或波长之间的间隔。对于长波通滤波器,二分之一波长的截波点称倍波程;对于短波通滤波器,二倍波长的截波点称倍波程。倍波所对应的强度的对数与截波所对应的强度的对数之差的称滤波器陡度。对带通滤波器的波长特性曲线,两截波间的波长范围称波带。截波、陡度和波带是描述滤波器件性能常用的三个参数。看来很多领域学科都用到这个专业名词。上面说的
PyCWT是用于连续小波谱分析的Python模块,它包括小波变换和FFT算法统计分析的常规操作的集合。此外,该模块还包括交叉小波变换、小波相干性测试和样例脚本。该模块需要NumPy和SciPy,matplotlib模块。
基频(fundamental frequency)自由振荡系统的最低振荡频率,复合波中的最低频率。复合振动或波形(如声波)的第一谐波成分,它具有最低频率,且通常具有最大振幅,亦称“基谐波”,或一次谐波。谐波,从字面解释,谐,有“多部分”的意思,谐和,指多部分协调有致。波,指的是波形(Wave)。合起来形容,就是有很多种波形合成的波形。时域描述,一般用。...
通过研究发现,DCT除了具有一般的正交变换性质外,其变换阵的基向量很近似于Toeplitz矩阵的特征向量,后者体现了人类的语言、图像信号的相关特性。因此,在对语音、图像信号变换的确定的变换矩阵正交变换中,DCT变换被认为是一种准最佳变换。在近年颁布的一系列视频压缩编码的国际标准建议中,都把 DCT 作为其中的一个基本处理模块。
分贝,功率,功率谱,功率谱密度,信噪比分贝:(decibel,/'dɛsɪ.bɛl/,用dB表示)是量度两个相同单位之数量比例的计量单位,主要用于度量声音强度。“分”(deci-)指十分之一,个位是“贝”(bel),一般只采用分贝。分贝是以美国发明家亚历山大·格雷厄姆·贝尔(Alexander Graham Bell)的名字命名的。贝尔(B),即1B = 10dB功率和分贝的关系:分贝是描述功率增