logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

(已实现)相似度到大数据查找之Mysql 文章匹配的一些思路与提高查询速度

当时只理解到这个层面,是想从园子里删除的,没删成功。所以重新整理了下。 需求,最近实现了文章的原创度检测功能,处理思路一是分词之后做搜索引擎匹配飘红,另一方面是量化词组,按文章、段落、句子做数据库查询,功能基本满足实际需求。接下来,还需要在海量大数据中快速的查找到与一句或者一段话最相关的文章、段落。上一篇随笔里记录有当时的一些想法,今天下午按想法具体实现并测试了一次,速...

#数据库#大数据#python
到底了