logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

python3使用fasttext进行中文文本分类

本文完成在python3下,利用fasttext对中文文本进行分类。期间使用了jieba分词。数据集本文使用skdjfla在github上的头条新闻数据集.包括新闻数据382688条(只包含标题),共15个类别。数据预处理fastext包进行文本分类类似于sklearn,已经进行完整封装,只需要生成指定格式的文本文件即可以开始训练。文件格式如下(__labe__为类别标记)2018 年...

文章图片
#分类#数据挖掘#人工智能
均值漂移(Meanshift)算法流程

均值漂移算法是一种常见的聚类算法,经常被应用在图像识别中的目标跟踪、数据聚类等场景中。该算法思想比较简单,对于给定的一定数量样本,首先随便选择一个点,然后计算该点一定范围之内所有点到中心点的距离向量的平均值作为偏移均值(也就是改点范围内的质心),然后将中心点移动到偏移均值位置,通过这种不断重复的移动,可以使中心点逐步逼近到最佳位置。也即:该点会从随机点移动到高密度中心点。我看到大部分介绍均值...

文章图片
#机器学习
使用 DuckDuckGo API 实现多种搜索功能

免费搜索/翻译API DDGS介绍。DuckDuckGo 是一个较大的搜索引擎,本文将介绍如何使用 DuckDuckGo 的搜索 API。

文章图片
#搜索引擎
移动光猫开启多lan端口上网-HG6821M(2020)

背景由于家里更换运营商,导致原电信多端口光猫变成了移动光猫-HG6821M,起初还是很开心的发现有4个千兆lan口,直到接了第二lan口接了路由器发现没有网络才发现移动默认只能一个lan口一个账号,不能多个端口都开启。当时简单百度看了一下,发现好像是只能有一个lan口可用,就买了个千兆交换机,用了两天。曙光–发现超级账号我无意见看到一篇写移动光猫开启多端口的帖子,具体里面有一些比较他当时开启多端口

#javascript
ubuntu 单网卡 安装lede作旁路由

由于服务器上的各类操作(编译、打包、装包等等)往往相对底层、不像浏览器直接chrome安装插件就可以完美使用代理, 所以在服务器上使用代理往往显得有点艰难。常见的linux环境使用代理的方法大概有:EXPORTexport http_proxy=http://proxyAddress:port添加相应命令app的个性化配置 比如添加pip.conf, apt.conf, 或者 git ...

#linux#网络#docker
文本聚类方法之传统聚类,LDA,深度聚类方法

文章目录一、基于文本特征的方法聚类算法1.K-Means算法2.均值漂移算法3.层次聚类4.谱聚类算法5.DBSCAN密度聚类算法sklearn代码二、潜在语义分析三、深度学习方法聚类的应用场景没有分类广泛,而由于无监督其算法效果也不足已运用到生产环境中去,不过其仍然是机器学习中的一个重要组成部分。文本聚类常见的应用场景就是文档标签生成,热点新闻发现等等,另外,在处理文本特征时,也可以使用聚类形.

#算法
文本聚类方法之传统聚类,LDA,深度聚类方法

文章目录一、基于文本特征的方法聚类算法1.K-Means算法2.均值漂移算法3.层次聚类4.谱聚类算法5.DBSCAN密度聚类算法sklearn代码二、潜在语义分析三、深度学习方法聚类的应用场景没有分类广泛,而由于无监督其算法效果也不足已运用到生产环境中去,不过其仍然是机器学习中的一个重要组成部分。文本聚类常见的应用场景就是文档标签生成,热点新闻发现等等,另外,在处理文本特征时,也可以使用聚类形.

#算法
到底了