logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CTC模型、安装及其pytorch绑定安装

CTC模型是语音识别模型中常见的模块之一,现有主流的语音识别系统经常采用该模型来实现端到端的语音识别。而CTC出现之前,语音识别模型的端到端识别效果还是相对较弱的,也就是说CTC解决了这一问题。1、CTC的相关原理深度学习的序列到序列模型可以解决许多现实任务,如:Image ClassificationImage GenerationLanguage ModelingSen...

#语音识别
微软开源认知服务CNTK的测试(语音训练)

前段时间,微软开源了认知服务的工具箱,直到近期才有时间进行测试。看了文档,这个CNTK工具包还是非常厉害的,可以支持语音识别,图像分类,机器翻译等多种任务。里面也集成了多种深度学习的模型。suchas deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networ

基于Tensorflow的VCTK语音识别例子测试

语音识别是深度学习早先攻克的几个领域之一。传统的基于HMM等的语音识别精度一直比较受限。但是深度学习还是给语音识别的精度带来了一个飞跃性的提高。本文在网上找了段代码实现了下,感觉非常简单就可以复现。不过看了过程,也非常简单,主要有几步:(1) 下载VCTK数据集;(2) 对数据集,提取每个WAV文件的MFCC特征以及对应的语音文本标注语料。(3) 设置CTC的损失目

#tensorflow#语音识别
Python3.6安装sqlite3的终极解决办法(

最近重装了系统之后,发现原有的python3环境下安装sqlite3(见原来博客:ubuntu环境下 python 3.0以上版本对sqlite3的支持问题)的办法已经行不通了。   即使安装了libsqlite-dev之后,仍然会报这样的错误:omnisky@omnisky:~/work/soft/Python-3.6.2$ pythonPython 3.6.2 (default, J

#python#ubuntu
pytorch实践中module 'torch' has no attribute 'form_numpy'问题的解决

最近开始仔细玩了一下pytorch,发现里面有个BUG之前都没有发现。在测试torch最基本的示例的情况下,居然碰到了个pytorch无法转化numpy为Tensor的问题,呈现的问题如下:ndscbigdata@ndscbigdata:~/work/change/AI$ pythonPython 3.6.1 (default, Jul 14 2017, 17:08:44)[GCC

#pytorch
SentencePiece的中文测试实践

许多自然语言处理程序中都用到了谷歌开源的SentencePiece作为词切分的基础工作之一,于是跟踪学习了下。1、基本介绍What is SentencePiece?SentencePiece is a re-implementation ofsub-word units, an effective way to alleviate the open vocabulary probl...

基于Tensorflow.js实现浏览器级别的目标识别应用实践

tensorflow.js 是谷歌于今年推出的浏览器级别的深度学习框架,TensorFlow 团队在其github官网上也公开了表示基于网页的 JavaScript 库 TensorFlow.js 库框架及其相关的例子。基于该应用能训练并部署机器学习模型。1、Tensorflow.js介绍  TensorFlow.js 是一个开源的用于开发机器学习项目的 WebGL-accelerated...

DrQA实践

2017年七月份Facebook开源了其开放域问答系统DrQA的代码。关于DrQA,还有一篇2017年发表在ACL上的论文《Reading Wikipedia to Answer Open-Domain Questions》,在此首先介绍一下论文的原理。    DrQA模型主要分为两部分,第一部分Retriever和第二部分Reader,Retriever根据问题检索出维基百科语料库中最相关的

Spark Hbase读取操作的一些总结与测试

Spark连接HBase实现查询的操作有好多种步骤,其中常用的是直接调用Hbase本身提供的写入和读出的接口。然而不少人在此基础上进行了各种封装,有的支持spark sql on Hbase,著名如华为开源的astro,但是这个也非常有局限性,其仅支持spark 1.4.0,其中的源码已经远远无法适应1.6.0以上的版本。另一种思路是实现Hbase作为Spark的一种数据源

#hbase#spark
知识图谱的语义相似度计算框架Sematch实践

Sematch是一个用于知识图谱的语义相似性的开发、评价和应用的集成框架,其代码见github。 Sematch支持对概念、词和实体的语义相似度的计算,并给出得分。 Sematch专注于基于特定知识的语义相似度量,它依赖于分类( 比如 ) 中的结构化知识。 深度、路径长度 ) 和统计信息内容( 语料库与语义图谱) 。 其应用框架如下所示:从图中可见,其支持多样化、多层次的相似度计算。如其DEMO上

#知识图谱
暂无文章信息