logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Word2vec神经网络详细分析——TrainModelThread分析

1.      TrainModelTread的流程图总的来说是这样的:(1).所有训练集中的词被等分成n份(n为线程数),所有的词都会迭代5次(5次是默认值,这个可以在参数中设置),因此,每个线程会反复读5次自己管辖内的词。(2).每次按照句子来读入词,一次读入一句,一句读入后,逐个词进入神经网络训练。等这句话的所有词都训练完成后,再读入下一句。(3).当读到线程管辖文件

#word2vec
snake算法总结

snake是一种主动轮廓模型,笨妞对主动轮廓模型的理解:你先给它一个初始轮廓,模型以初始轮廓为基准逐步迭代,来改进图像的轮廓,使其更加精确。主动轮廓模型目前用到了2种:CV和snake。前者没有看算法内部的原理。而snake,以最原始的论文《Snakes: Active Contour Models》为出发点。1. snake原理snake在逐步迭代优化过程的目标是能量函数最小化,这个能量函数指的

图像特征提取三大法宝:HOG特征、LBP特征、Haar-like特征

转自http://dataunion.org/20584.html(一)HOG特征1、HOG特征:方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行

#opencv#图像处理
标准误差和标准偏差

标准偏差和标准误差是统计学中的两个变异性估计量。两者只有一字之差,但是所表示的估计含义却很不同。首先,从英文名字来讲,标准偏差是standard deviation,deviation有“离差”的意思,标准偏差表征的是数据的离散程度;而标准误差的英文名是standard error,表征的是单个统计量在多次抽样中呈现出的变异性。可以这样理解,前者是表示数据本身的变异性,而后者表征的是抽样行为的..

大脑的功能框架

作为一个人工智能工作者,虽然经常用人工神经网络,但对生物神经网络并没有多大兴趣,直到半年前,我那年纪并不大的老爹因为高血压发生急性脑梗塞,有一些脑组织被损伤了,我觉得是时候学点脑科知识了。我们习惯把我们的脑称作大脑,人的脑组织中大脑占了很大部分,但也有很多别的部分,例如,小脑、脑干。在关注这块之前,对于笨妞来说,这些总体称为大脑。但是,脑科学界貌似并不这么认为。大脑是人脑的高级进化区域,小脑和脑干

Word2vec+seq2seq实现对话系统

ChatScript做对话系统,做到一定程度后,便遇到了天花板,主要的瓶颈是中文wordnet比较难弄。下面先用word2vec+seq2seq尝试一下,基于机器学习的对话系统。如题,整个程序主要又两部分组成,word2vec将训练语料首先做词向量化,然后,用向量输入到seq2seq中训练。实际上tensorflow本身已经有一个完整的seq2seq模型,可以直接拿来训练,且tf自带的模型

#tensorflow
gensim doc2vec + sklearn kmeans 做文本聚类

前一篇用doc2vec做文本相似度,模型可以找到输入句子最相似的句子,然而分析大量的语料时,不可能一句一句的输入,语料数据大致怎么分类也不能知晓。于是决定做文本聚类。选择kmeans作为聚类方法。前面doc2vec可以将每个段文本的向量计算出来,然后用kmeans就很好操作了。选择sklearn库中的KMeans类。程序如下:# coding:utf-8import sysi

#kmeans
菜鸟妞的数字图像模式识别之旅(1)

休息了8个月,终于开始了新的工作。到岗之前一直不知道新工作具体是做什么,只知道是算法工程师。好吧,既然是我喜欢的算法,又能差多远呢。到岗后,妞一个做UPS经典PID控制的菜鸟,居然被分配来做数字图像处理,模式识别之类的。而且所在的组是新组建的,没有任何技术积累。既然做就做吧!谁怕谁!菜鸟妞的第一项工具——opencv.

#图像处理
CDL(协同深度学习)——一种基于深度学习的推荐系统

此文实际上是读论文《Collaborative Deep Learning for RecommenderSystem》的读书笔记。这一篇论文出自香港理工大学王灏博士,论文讲了一种紧耦合的混合式推荐算法。主要是栈式自编码器sdae和CTR通过贝叶斯图方式结合。1.      概述        当前推荐算法主要是基于内容(CB)、协同过滤(CF)、混合算法。基于内容的推荐依靠用户pro

到底了