logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Linux、Windows下试用DarkNet之YoLo CPU物体识别

关于YOLO:YOLO——You Only Look OnceFaster RCNN需要对20k个anchor box进行判断是否是物体,然后再进行物体识别,分成了两步。 YOLO(You Only Look Once)则把物体框的选择与识别进行了结合,一步输出,即变成”You Only Look Once”。 所以识别速度非常快,达到每秒45帧,而在快速版YOLO(Fast YO

推荐使用的超级简单paddlepaddle机器学习入门

折腾了大半天,最后发现自己只需要这样的一个环境jupyter:新手真的不建议去手动编译什么的(国内的网络)硬是搞得残废了~~~~大前提是你成功安装了docker容器(能够成功运行hello-world)一、安装paddlepaddle/book docker镜像houwenbin@houwenbin-GA-6UASL3:~$houwenbin@houwen

#机器学习
拷贝一下Docker中Kaldi for android编译步骤,手动编译也可以参照此步骤

来源于:https://github.com/jcsilva/docker-kaldi-androidDockerfile:FROM ubuntu:16.04RUN mkdir -p /opt/android-sdk-linux && mkdir -p ~/.android && touch ~/.android/repositories.cfgENV WORKING_DI

#android
运行Kaldi yesno实例时version `GLIBCXX_3.4.21' not found的原因

最近开始倒腾Kaldi走了一些弯路,一心想在Windows上摸索,编译神马的都OK,最后却拦在了Kaldi最核心、最重要的脚本上;由于Windows下对软连接支持不好(甚至说是完全不能),放弃!!!转为linux(这个才是与国际接轨的)下:Linux下也是经历了很多曲折,什么GCC版本过低等等~~~~今天的话题是利用升级后的GCC编译完成Kaldi程式后,脚本运行时出现的“versio

#语音识别
Gin微框架入门——路由天下

Gin的基本入门案例:package mainimport ("github.com/gin-gonic/gin""net/http")func main() {router := gin.Default()////http://127.0.0.1:8080/params?firstname=lcd&lastname=dongrouter...

Kaldi中nnet3进行语音识别过程中用到的部分工具集锦!!!

前一篇文章我们对Kaldi ASR有了初步的了解,我们再来看看怎么使用Kaldi的神经网络模型NNET3来进行wav文件语音识别~~~~下载中文预训练模型:[houwenbin@localhost ~]$ cd ~/kaldi-master/egs[houwenbin@localhost egs]$ wget -T 10 -t 3 http://kaldi-asr.org/models

#语音识别#神经网络
使用微软的语音识别引擎Microsoft Speech API进行语音控制

以下代码来自:http://mmcheng.net/zh/imagespirit/ 本人仅作提取:SREngine语音识别引擎封装类:#pragma once/************************************************************************//* Notice: this project is use

#语音识别
机器学习中的End-to-End到底是怎么回事?

简单讲就是,Input--->系统(这里指神经网络)--->Output(直接给出输入,NN神经网络就给出结果,一气喝成!!!)借用一段对话:

#机器学习
Kaldi中如何使用已经训练好的模型进行语音识别ASR呢?

我们如何运用已经训练好的模型进行语音识别呢?这才是我们研究的目的啊,是不?很好,细心的你一定会发现kaldi源码src目录中有online*相关的模块,这就是我们今天的主角啦!!!Kaldi中有两个版本的online、online2分别是第一代、第二代,现在已经不维护online,转到online2了,但作为我们入门的,我建议还是选择online,由简入深嘛!!!默认kaldi

#语音识别
到底了