logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

rk3568上webrtc处理稳态噪声实践

大家好,在上一篇文章里面,我给大家介绍了webrtc里面的ns降噪处理流程,本篇文章,我给大家带来webrtc处理稳态噪声的一个测试,非稳态噪声,暂时没有测试,我们一步一步来,我先从最为基本的内容开始,后面再步入到算法原理细节,也就是webrtc里面的ns模块源码研究学习。从今天的文章开始,我们就正式打通了webrtc音频降噪功能了,有实操有理论,完美,当然后面的内容还有很多,我尽量把自己理解到的

#webrtc#算法
从零写一个ALSA声卡驱动学习(7)之ALSA内存管理

由于历史原因,Playback Mask 和 Playback Default 控制项的两种形式都可以在 SNDRV_CTL_ELEM_IFACE_PCM 或 SNDRV_CTL_ELEM_IFACE_MIXER 接口上实现。要创建 SG 缓冲区处理器,可以在 PCM 构造函数中调用 snd_pcm_set_managed_buffer() 或 snd_pcm_set_managed_buffer

文章图片
#学习
rtp三种模式传输打包规则:single nalu、non-interleaved、non-interleaved

禁止使用 STAP(单时间聚合包)、MTAP(多时间聚合包)和 FU(分片单元)。● 对于属于同一编码图像(coded picture)的编码切片 NAL 单元(coded slice NAL units)或编码切片数据分区 NAL 单元(coded slice data partition NAL units)(即它们共享相同的 RTP 时间戳), 可以(MAY)以任意顺序发送;序列参数集和图像

文章图片
#网络
从零写一个ALSA声卡驱动学习(6)之AC97驱动实现解析

但如果你需要在驱动中修改寄存器值,或者需要对 AC97 编解码器执行挂起/恢复(suspend/resume)操作,那么就需要保留这个指针,以便传递给相应的函数。以下寄存器可用于设置采样率:AC97_PCM_MIC_ADC_RATE、AC97_PCM_FRONT_DAC_RATE、AC97_PCM_LR_ADC_RATE 和 AC97_SPDIF。当一张声卡上有多个编解码器(Codec)时,你需要

文章图片
#学习
从零写一个ALSA声卡驱动学习(4)

已分配缓冲区的物理地址存储在 runtime->dma_area 中,缓冲区大小和 period 大小则分别存储在 runtime->buffer_size 和 runtime->period_size 中。对于大多数只需要调用 synchronize_irq() 的驱动,还有一个更简单的做法:在不实现 sync_stop 回调(即设置为 NULL)的前提下,驱动在申请中断后将返回的中断号赋值给

文章图片
#学习
嵌入式音频3A算法学习汇总

这本书是麦克风阵列信号处理的经典教材,专门讲解 麦克风阵列理论 + 算法 + 应用,在回声消除 (AEC)、噪声抑制 (NS)、波束形成 (Beamforming) 等“音频 3A”相关领域有很大参考价值。经典的 语音增强 专著,详细介绍噪声抑制(NS)、语音质量评估方法(PESQ、STOI)、语音增强算法(谱减、维纳滤波、MMSE)。这本书偏经典语音信号处理,包含 端点检测、增益控制、噪声鲁棒性

#音视频#算法#学习
alsa之ASOC架构学习

Codec(Coder/Decoder) 是一个 音频编解码芯片,负责:把模拟信号(来自麦克风)转换为数字信号(ADC),或把数字音频信号(来自 CPU/DSP)转换为模拟信号(DAC)。例如常见的外部音频 Codec 芯片:AK4556、CS42L52 等这些芯片通过 I²S、TDM、PCM、AC97、SPI、I²C 等总线与 SoC 连接。🔹 Mixer(混音器)用于将多个输入源(Mic、L

#架构
rnn的音频降噪背后技术原理

这是一个传统噪声抑制算法的概念图示。2、避免“音乐噪声(musical noise)”伪影: 所谓音乐噪声,是指噪声抑制时只让一个频点通过,而旁边的频点被强烈压制,从而产生类似“哒哒哒”或“嗡嗡嗡”的金属感杂音。如果使用较宽的频带,我们要么让整段频带通过,要么整体压制,这样就不会留下孤立的频点,从而避免这种伪影。此外,我们的目标也和很多使用深度学习做语音降噪的研究不同: 我们关注的是实时通信,而不

文章图片
#rnn#人工智能#深度学习 +2
从零写一个ALSA声卡驱动学习(1)

不过,至少 ALSA 的内核 API 是一致的,因此本文档在编写这些驱动时仍然具有一定的参考价值。“card” 记录是声卡的核心管理结构,它负责管理该声卡上的所有设备(组件),例如 PCM、混音器(Mixer)、MIDI、合成器等。虽然 Linux 系统本身有标准的 i2c 层,但某些声卡只需要简单的操作,而标准的 i2c API 过于复杂,因此 ALSA 对某些声卡实现了自己的 i2c 代码。在

文章图片
#学习
从零构建webrtc音频降噪工程代码!

现在我们打通了第一步工程构建,后面就是原理和webrtc降噪的原理以及降噪效果的实践学习,我个人感觉按照这种方式去学习音频算法会更简单,循环渐进,因为音频算法本身比较难,不要上来就看源码和看原理,会比较枯燥的;而是先看效果,然后再带着疑惑一步一步找自己想要的东西。大家好,我在之前的文章里面已经给大家分享过rk3568平台移植webrtc audio procssing的移植,这个平台不限制,都可以

#webrtc#音视频
    共 25 条
  • 1
  • 2
  • 3
  • 请选择