logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

麦克风阵列坐标、角度与到达时延换算(波束成形核心科普)-- 来自豆包

本文专为复习波束成形(MVDR/GSC)核心原理设计,聚焦「麦克风阵列坐标→方向角→到达时延」的完整换算逻辑,用通俗语言+工程实操公式,讲透每一步原理,避免复杂冗余,适合后续复习查阅,配套之前的波束成形流程图、阵列坐标案例(AISHELL-4、CHiME4),无缝衔接实际代码应用。结论:M03在正前方(Y轴正方向),比阵列中心多走0.06m,声音先到达M03,再到达阵列中心,时延约175微秒。结论

#算法
麦克风阵列坐标、角度与到达时延换算(波束成形核心科普)-- 来自豆包

本文专为复习波束成形(MVDR/GSC)核心原理设计,聚焦「麦克风阵列坐标→方向角→到达时延」的完整换算逻辑,用通俗语言+工程实操公式,讲透每一步原理,避免复杂冗余,适合后续复习查阅,配套之前的波束成形流程图、阵列坐标案例(AISHELL-4、CHiME4),无缝衔接实际代码应用。结论:M03在正前方(Y轴正方向),比阵列中心多走0.06m,声音先到达M03,再到达阵列中心,时延约175微秒。结论

#算法
BF信号是如何多路合一的

││ Ch2 ────┼──┼──▶ w₁·x₁ + w₂·x₂ + …│[AIC] ─────┴─▶ 估计的干扰 ─────┘│。│Ch2 ─┤时延补偿│延迟求和│││。│ChM ─┘│主路径减法器──▶输出│。

#算法
学习笔记:SKILLS 能帮助更好的vibe coding

引用“Skills are reusable capabilities for AI agents.”用一个码农思维,就是ai对通用性的/专用性的东西封装的一个api。摸索了一段ide 和open code等环境,切实体会到生成模型的shithill能力,也许skill能让AI给出更加靠谱的代码。

文章图片
#学习
ALC AGC DRC-容易混淆的音频前端算法

音频前端距离模拟端最近的数字信号是需要动态改变幅值的,输出端即希望饱满的声音,有担心幅值大引起失真,所以DRC就必不可少,简单的可以用limiter来处理;采集端希望捕获的信号能在最佳表达区间,所以agc就需要了,如果没有真实的模拟gain控制,也可称为alc-自动电平控制(这么解释也很牵强,两者的表达的控制主体不一样,实质是一回事),即对采集的信号进行数字增益控制。

文章图片
#音视频#算法
从vibe coding迈向harness engineering,和shit hill 与 熵增说byebye。

是“启蒙运动”,让所有人看到了AI编程的可能性。是“工业革命”,找到了如何规模化、工程化地使用AI的方法。是“专业分工”,重新定义了人在AI时代的核心价值和角色。如果你还在享受Vibe Coding的乐趣,说明你正处在AI编程的探索期;如果你开始思考如何设计“缰绳”来驾驭AI,说明你进入了Harness Engineering的实践期;而当你意识到自己的价值在于指挥AI代理完成复杂系统时,你就已经

文章图片
#人工智能
学习笔记:SKILLS 能帮助更好的vibe coding

引用“Skills are reusable capabilities for AI agents.”用一个码农思维,就是ai对通用性的/专用性的东西封装的一个api。摸索了一段ide 和open code等环境,切实体会到生成模型的shithill能力,也许skill能让AI给出更加靠谱的代码。

文章图片
#学习
撸一撸数字麦克风相关的核心技术

ECM和MEMS的演进应该有很多故事,但这里最值得关注的是MEMS麦克风提供了数字输出接口,相对于传统的模拟电平传感器,用户可以直接省掉ADC,目测成本上似乎更有优势,但数字输出的格式不是数字音频工程师最熟悉的PCM,而是PDM。

文章图片
#实时音视频#算法
一阶shelf IIR数字滤波器的设计和实现

一阶高低shelf 滤波器可以理解为按住一头,调整另一头的滤波器。low shelf滤波器就是高频部分直通,低频部分可调

研究一下exp, ln, pow的数值计算

exp, ln, pow的数值计算一级目录二级目录参考一级目录二级目录参考Numerical Approximationshow is log(x) calculated指数函数e^x的快速计算方法DSP Trick: Quick-and-Dirty Logarithms

    共 23 条
  • 1
  • 2
  • 3
  • 请选择