
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
问答系统的流程如下:①获取原始文本②分词③文本清洗,包含:html标签、stop words(a,an,the等)、纠错、大小写转换等③文本标准化,比如:go, went, going, gone这一类词全部映射为go④转为向量,方法:boolean vector / count vector / tfidf / word2vec / seq2seq等⑤建模,比如把库中的内容根据相似度排序然后返回

属性分类流程。

问答系统的流程如下:①获取原始文本②分词③文本清洗,包含:html标签、stop words(a,an,the等)、纠错、大小写转换等③文本标准化,比如:go, went, going, gone这一类词全部映射为go④转为向量,方法:boolean vector / count vector / tfidf / word2vec / seq2seq等⑤建模,比如把库中的内容根据相似度排序然后返回

问答系统简单实现,用倒排表及词向量优化。

目录一、假如训练集表现不好1.尝试新的激活函数2.自适应学习率①Adagrad②RMSProp③ Momentum二、在测试集上效果不好1.提前停止2.正则化3.Dropout一、假如训练集表现不好1.尝试新的激活函数ReLU:Rectified Linear Unit图像如下图所示:当z<0时,a = 0, 当z>0时,a = z,也就是说这个激活函数是对输入进行线性转换。使用这个激

目录一、模板预处理1.将模板设置为二值图2.检测模板的轮廓3.对模板轮廓排序,并将数字和轮廓一一对应,以字典存储4.备注二、图片预处理1.初始化卷积核2.图片预处理第一部分3.图像预处理第二部分三、轮廓处理1.大轮廓过滤2.小轮廓分割模板图片如下:需识别的图片如下:一、模板预处理1.将模板设置为二值图2.检测模板的轮廓3.对模板轮廓排序,并将数字和轮廓一一对应,以字典存储排序的函数如下:...

1.图像金字塔高斯金字塔:向下采样,数据会越来越少,减少的方式是:将偶数行和列删除向上采样,数据会越来越多,将图像在每个方向上扩大为原来的两倍,新增的行和列用0来填充。使用先前同样的内核与放大后的图像卷积,获得近似值。上采样之后,图片会变大。下采样后,图片会变小。拉普拉斯金字塔:对于原始图像,先执行下采样,再执行上采样,并用原始图像减去得到的采样结果。以上的计算方式为1层,第二层的计算,把第一层得

概率基础概率:某件事情发生的可能性。联合概率:包含多个条件,并且所有条件同时成立的概率记作:P(A,B)P(A, B) = P(A) * P(B)条件概率:事件A在另外一个事件B已经发生的条件下的发生概率记作:P(A|B)特性:P(A1,A2|B) = P(A1|B)P(A2|B)注意:此条件概率的成立,是由于A1,A2相互独立的结果朴素贝叶斯原理:对于每一个样本,算出属于每一个类别的概率,归为概
