logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

云服务器使用(阿里云、腾讯云、华为云、百度云)

云服务器是一种可弹性伸缩的计算服务,它模拟了物理服务器的功能(包括 CPU、内存、操作系统、磁盘、网络),但运行在云端虚拟化环境中。用户无需购买和维护实体硬件,按需付费,并通过网络远程管理。

文章图片
#服务器#阿里云#腾讯云
Linux-网络抓包

在嵌入式Linux开发中,网络通信的调试与分析是至关重要的环节。无论是排查复杂的网络协议交互问题,还是进行性能瓶颈分析,网络抓包都是工程师不可或缺的核心技能。与通用服务器环境不同,嵌入式设备通常资源受限、接口多样,且可能缺乏图形界面,这使得抓包工具的选择和流程更具挑战性。本文将深入探讨在嵌入式Linux环境下进行网络抓包的全套技术方案。我们将从基础工具原理讲起,逐步深入到高级抓包技巧、嵌入式环境适

文章图片
#linux#网络#运维
Linux-网络编程实战

嵌入式Linux网络编程的核心在于理解Socket抽象和TCP/UDP协议的特性。从简单的回声服务器入手,逐步掌握多路复用、非阻塞I/O等高级技术,是构建稳定、高效嵌入式网络应用的必经之路。交叉编译工具链的配置。目标板的网络配置(IP、路由、防火墙)。使用更上层的库(如libeventasio)来简化开发。进行充分的压力测试与异常测试,模拟网络断连、数据包乱序等场景。希望本文能为你打开嵌入式Lin

文章图片
#linux#网络#运维
智能语音技术(十)

Audacity:免费开源的音频编辑软件,适合进行简单的语音切割和转写。ELAN:多模态标注工具,支持音视频同步标注,适合说话人分离和副语言标注。:开源数据标注平台,支持语音标注插件,可自定义标注界面和导出格式。商业平台:如百度智能云数据标注、阿里云数据标注平台,提供一站式标注服务和项目管理功能。## 6. 总结与展望语音标注是一项既需要语言学知识,又需要耐心和细致的工作。

文章图片
#语音识别#人工智能
智能语音技术(九)

语音听写(Speech-to-Text, STT),也称为自动语音识别(Automatic Speech Recognition, ASR),是指将人类语音信号自动转换为相应文本的技术。结合声学模型和语言模型的输出,在可能的候选序列中搜索最优(概率最大)的文本序列。利用语言的统计规律(词与词之间的组合概率),约束解码过程,提高识别准确率,特别是解决同音词歧义。负责将提取的特征序列映射到基本的语音单

文章图片
#语音识别#人工智能
智能语音技术(二)

声音特征本质上是语音信号在时域、频域或其他变换域(如倒谱域)上的数学表示。它们旨在捕捉语音信号中与说话人身份、语言内容、情感状态、环境噪声等相关的关键信息。声音特征是智能语音技术的基石。理解各种特征的物理意义、感知基础和计算方法,以及它们在不同任务中的适用性,对于设计、开发和优化智能语音系统至关重要。物理声学特征(尤其是 MFCC)和感知特征提供了基础,而模型驱动特征则代表了当前的研究前沿和应用趋

文章图片
#语音识别#人工智能
智能语音处理(一)

前置放大器的作用是将信号放大至适合模数转换器(ADC)处理的电平范围(通常在1Vpp左右)。例如,驻极体麦克风的输出信号约为10mV,经过20-60dB(即10-1000倍)的增益放大后,信号幅度可提升至0.1-10V范围。在会议室录音场景中,频率范围通常为300-3400Hz(语音主要频段),采样时需确保麦克风频响特性覆盖该范围。采样前必须通过抗混叠滤波器(低通滤波器)限制信号带宽,避免高频成分

文章图片
#语音识别#人工智能
智能语音技术(四)

谱减法是语音增强领域的基石之一。虽然基本形式存在音乐噪声等问题,但其思想启发了大量后续研究(如MMSE系列算法)。在平稳噪声环境下,即使是基本谱减法也能有效提升SNR。改进的谱减法(如MMSE-STSA)在客观指标和主观听感上都有显著提升,并被用作后续深度学习语音增强方法的基准对比算法之一。评估这些算法常用的数据集包括TIMIT(纯净语音)和NOISEX-92(噪声),实验结果通常报告客观SNR提

文章图片
#语音识别#人工智能
智能语音技术(三)

梅尔频率倒谱系数(MFCC)是语音信号处理中最常用的特征提取方法之一。

文章图片
#语音识别
    共 26 条
  • 1
  • 2
  • 3
  • 请选择