logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音识别算法原理文档整理(一)

MFCC提取过程声音是模拟信号,声音的时域波形只代表声压随时间变化的关系,不能很好的代表声音的特征,因此,必须将声音波形转换为声学特征向量。目前有许多声音特征提取方法,如梅尔频率倒谱系数MFCC、线性预测倒谱系数LPCC、多媒体内容描述接口MPEG7等,其中MFCC是基于倒谱的,更符合人的听觉原理,因而是最普遍、最有效的声音特征提取算法。在提取MFCC前,需要对声音做前期处理,包括模数转换、预..

怎么写出计算机SCI论文

关于英语,最好的学术写作方法永远都是模仿:下载十几篇跟你做的方向类似的文章,参考他们写作的英语句子,变换一下改成自己的,这样最稳妥,语法大部分都能过关。...

算法工程师程序员职业规划

算法工程师程序员职业规划自从硕士毕业后,一直从事算法方面(视频编解码,深度学习,全景VR)的工作,目前人到中年,感觉有点在十字路口,不知道未来规划是什么样的,因为最近搜索了网上关于程序员的职业生涯规划。根据自己理解,找出我认为值得我后面注意的地方,记录下来,朝着正确的方向前行。目前下面的内容基本赞向,唯一不确定的是到底是在某个技术方向深耕好,还是在某个方向有优势的前提下发展多个方向。 ...

深度学习开源项目

1.掌握深度学习图像处理(基于keras、tensorflow、opencv)2.掌握web前后端设计(基 于flask框架)3.开发基于web端的深度学习图像,把web端应用与人工智能相结合各位同学,代码开源了,欢迎star,https://github.com/gdit-ai/deep-learning-of-web欢迎加入人工智能算法应用开发,群号码:971601256视频教程: https

深度学习图像分类开源项目(3)-使用flask web调用深度学习模型

该完整项目由团队协作完成,已上传至GitHub,点击直达gdit-ai环境配置系统环境:Ubuntu16.04 LTS、python3.x、Anaconda3和相关的编辑器所需python库:numpy、tensorflow、Keras、opencv、Flask及相关依赖必备知识编辑器:Pycharm和HBuilder X后端:python3.x、Flask前端:前端三大件(htm...

基于web端的人脸识别算法视频教程

1.掌握深度学习图像处理(基于keras、tensorflow、opencv)2.掌握web前后端设计(基 于flask框架)3.开发基于web端的深度学习图像,把web端应用与人工智能相结合https://edu.csdn.net/course/detail/28400/391614?pre_view=1人脸识别实例:import face_recognitionfrom flask...

pytorch GPU版本安装

使用驱动精灵安装。

#大数据
深度学习与视频编解码算法一

论文:Variational image compression with a scale hyperprior大牛Johannes Ballé写的,必须要读。通过自编码器把图像压缩成latent representation(大小变为原始图像1/8 * 1/8)然后把latent representation通过统计概率使用熵编码进行编码。在熵编码由于不知道真实的字符概率,所以需要可以...

Tensorflow 实例

Tensorflow简介TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。TensorFlow可被用...

    共 25 条
  • 1
  • 2
  • 3
  • 请选择