2501_93893723 个人主页

@2501_93893723

2501_93893723

2025-10-21 19:16:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

‌LoRA微调OpenAI Whisper：中文语音识别的PEFT实践指南

LoRA的核心思想是在预训练模型的权重矩阵上添加低秩分解的适配器。假设原始权重为$W_0 \in \mathbb{R}^{d \times k}$，LoRA引入两个小矩阵$B \in \mathbb{R}^{d \times r}$和$A \in \mathbb{R}^{r \times k}$，其中$r \ll \min(d,k)$是秩（通常为4-32）。

#语音识别 #xcode

ESP32-S3+麦克风阵列：提升豆包语音助手的拾音质量

豆包语音助手作为一种智能语音交互系统，拾音质量直接影响用户体验（尤其在嘈杂环境中）。ESP32-S3 微控制器结合麦克风阵列，能显著提升拾音能力。通过 ESP32-S3 驱动麦克风阵列，豆包语音助手的拾音质量可大幅提升：方向性拾音提高定位精度，噪声抑制增强鲁棒性，整体 SNR 提升 30-50%。最终，用户交互更流畅，尤其在远场或多噪声场景。将麦克风阵列接入 ESP32-S3，并通过软件优化豆包语

‌Flutter 3.0 跨平台开发：自定义渲染与性能调优

Flutter 的渲染流程基于 Widget → Element → RenderObject 三棵树。自定义渲染主要通过以下方式实现：CustomPaint 组件使用实现自定义绘制逻辑：RenderObject 直接操作继承实现底层渲染控制：Shader 特效利用片段着色器实现高级效果（需导入）：问题：500+ 粒子导致帧率降至 30fps解决方案：结果：帧率稳定至 60fps，内存占用降低

#flutter

‌YOLOv5的FPGA移植：算法优化与硬件资源分配

优先优化Backbone部分的$3\times3$卷积（占计算量70%），采用Winograd算法将乘法操作减少$2.25\times$；对Neck层的上采样使用双线性插值硬件加速器，避免消耗DSP资源。将YOLOv5模型部署到FPGA平台需兼顾算法精度与硬件效率，核心挑战在于优化计算密集型操作（如卷积）并合理分配有限资源。其中 $t_{\text{conv}}$ 为卷积延时，$t_{\text{

ESP32-S3+麦克风阵列：提升豆包语音助手的拾音质量

WebSocket 协议细节：帧格式与握手过程

WebSocket 默认端口与 HTTP 一致（80/443），但可运行于任意 TCP 端口。握手成功后，TCP 连接升级为 WebSocket 全双工通道。为126或127时，存储实际长度（大端序）。时存在，用于解码负载数据。

#websocket #网络协议 #网络

Edge-TTS如何实现语音合成中的语速调整？

在 Edge-TTS 中实现语音合成的语速调整主要通过控制rate参数实现。

#edge #前端

ESP32-S3+麦克风阵列：提升豆包语音助手的拾音质量

Trae AI 插件性能优化：如何减少生成代码的延迟

优先部署缓存和批处理（见效最快），逐步推进模型轻量化。最终可达成 60% 的延迟降低，满足实时交互需求（<200ms）。{\text{蒸馏}}(T_{\text{教师}}, T_{\text{学生}}) $$$$ \text{损失函数} = \alpha \cdot \mathcal{L}其中 $T$ 为模型输出分布，$\alpha, \beta$ 为权重系数。{\text{任务}} + \bet

#人工智能 #性能优化

零基础学Flutter：从安装到第一个应用的完整指南

通过本指南，您已完成从安装到运行的全流程！（仅Android开发）深入学习组件和状态管理。

共 15 条

请选择