
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
原文链接:https://www.ctolib.com/ZhishengWang-Embedded-Neural-Network.html Papers Reading List.This is a collection of papers aiming at reducing model sizes or the ASIC/FPGA accelerator for Machine L...
语音是一个连续的音频流,它是由大部分的稳定态和部分动态改变的状态混合构成。一个单词的发声(波形)实际上取决于很多因素,而不仅仅是音素,例如音素上下文、说话者、语音风格等;协同发音:(指的是一个音受前后相邻音的影响而发生变化,从发声机理上看就是人的发声器官在一个音转向另一个音时其特性只能渐变,从而使得后一个音的频谱与其他条件下的频谱产生差异。)的存在使得音素的感知与标准不一样,所以我们需要根据上..
踩内存就是访问了不应该访问的内存,本文介绍如何定位+解决+避免 踩内存问题。后续将不断补充、更新
转自:https://blog.csdn.net/denghecsdn/article/details/788480461、概念相关函数是描述信号X(s),Y(t)(这两个信号可以是随机的,也可以是确定的)在任意两个不同时刻s、t的取值之间的相关程度。两个信号之间的相似性大小用相关系数来衡量。定义:称为变量 X 和 Y 的相关系数。若相关系数 = 0,则称 ...
转自https://www.cnblogs.com/leexiaoming/p/7257198.html 非线性最小二乘介绍; 下降法相关理论(Desent Method); 信任区域理论(Trust Region Methods); 非线性最小二乘求解方法(高斯牛顿、LM)1. 非线性最小二乘介绍1.1. 最小二乘问题回顾: 在上一篇博客中我们知道最小二乘问...
1、什么是激活函数2、为什么要用3、都有什么激活函数4、sigmoid,Relu,softmax1. 什么是激活函数 如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数 Activation Function。2. 为什么要用如果不用激励函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的...
1. 自联想神经网络与深度网络 自联想神经网络是很古老的神经网络模型,简单的说,它就是三层BP网络,只不过它的输出等于输入。很多时候我们并不要求输出精确的等于输入,而是允许一定的误差存在。所以,我们说,输出是对输入的一种重构。其网络结构可以很简单的表示如下: 如果我们在上述网络中不使用sigmoid函数,而使用线性函数,这就是PCA模型。中间网络节点个数就是PCA模型中的主分量个...
1. 在平台搭建之前,有几点需要说明一下的:所谓的平台搭建,不仅包括固件的烧写,还包括开发,编译和调试的环境搭建。Openwrt平台是基于Linux的,其支持虚拟机安装,对于手边没有设备的亲们,可以通过安装虚拟机感受一下(木有图形界面,需要命令行控制)。2. Openwrt开发环境搭建流程(仅列出我本人所搭建的环境,以Atheros 9344为例):(1)操作系统: Ub...
语音识别 我们的声音进入电脑后,变成了下面的结构 (上面这个图也叫声音的“时域”图,因为声音通过话筒进入计算机,是按时间上的先后顺序来的) 我们来“描述”一下,他有什么特征:1. 中间区域内,“振荡”幅度特别大,而两边变化的比较小,(中间区域的内容是“yi”的发音的声音图两边的地方是“静音区”,即在录音开始时,我们没有发出声音,但电脑已经开始录...
首先要进行端点检测(VAD),然后对声音进行分析。需要对声音分帧,也就是把声音切成一小段一小段的,每一小段称为一帧,分帧时要使用移动窗函数来实现,帧与帧之间一般是有交叠,如下图所示,每帧长度是25毫秒,每两帧之间有25-10=15毫秒的交叠,称为以帧长25ms,帧移10ms的分帧。 分帧后,语音就变成了许多小段,在波形的时域上没有任何描述能力,因此必须将波形做变换。常见的一种变换...







