简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
关于YOLO:YOLO——You Only Look OnceFaster RCNN需要对20k个anchor box进行判断是否是物体,然后再进行物体识别,分成了两步。 YOLO(You Only Look Once)则把物体框的选择与识别进行了结合,一步输出,即变成”You Only Look Once”。 所以识别速度非常快,达到每秒45帧,而在快速版YOLO(Fast YO
折腾了大半天,最后发现自己只需要这样的一个环境jupyter:新手真的不建议去手动编译什么的(国内的网络)硬是搞得残废了~~~~大前提是你成功安装了docker容器(能够成功运行hello-world)一、安装paddlepaddle/book docker镜像houwenbin@houwenbin-GA-6UASL3:~$houwenbin@houwen
来源于:https://github.com/jcsilva/docker-kaldi-androidDockerfile:FROM ubuntu:16.04RUN mkdir -p /opt/android-sdk-linux && mkdir -p ~/.android && touch ~/.android/repositories.cfgENV WORKING_DI
最近开始倒腾Kaldi走了一些弯路,一心想在Windows上摸索,编译神马的都OK,最后却拦在了Kaldi最核心、最重要的脚本上;由于Windows下对软连接支持不好(甚至说是完全不能),放弃!!!转为linux(这个才是与国际接轨的)下:Linux下也是经历了很多曲折,什么GCC版本过低等等~~~~今天的话题是利用升级后的GCC编译完成Kaldi程式后,脚本运行时出现的“versio
Gin的基本入门案例:package mainimport ("github.com/gin-gonic/gin""net/http")func main() {router := gin.Default()////http://127.0.0.1:8080/params?firstname=lcd&lastname=dongrouter...
前一篇文章我们对Kaldi ASR有了初步的了解,我们再来看看怎么使用Kaldi的神经网络模型NNET3来进行wav文件语音识别~~~~下载中文预训练模型:[houwenbin@localhost ~]$ cd ~/kaldi-master/egs[houwenbin@localhost egs]$ wget -T 10 -t 3 http://kaldi-asr.org/models
以下代码来自:http://mmcheng.net/zh/imagespirit/ 本人仅作提取:SREngine语音识别引擎封装类:#pragma once/************************************************************************//* Notice: this project is use
简单讲就是,Input--->系统(这里指神经网络)--->Output(直接给出输入,NN神经网络就给出结果,一气喝成!!!)借用一段对话:
我们如何运用已经训练好的模型进行语音识别呢?这才是我们研究的目的啊,是不?很好,细心的你一定会发现kaldi源码src目录中有online*相关的模块,这就是我们今天的主角啦!!!Kaldi中有两个版本的online、online2分别是第一代、第二代,现在已经不维护online,转到online2了,但作为我们入门的,我建议还是选择online,由简入深嘛!!!默认kaldi