logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

120G+训练好的word2vec模型(中文词向量)

多人缺少大语料训练的word2vec模型,在此分享下使用268G+语料训练好的word2vec模型。训练语料:百度百科800w+条,26G+搜狐新闻400w+条,13G+小说:229G+模型参数:window=5min_count=10size=128hs=1negative=0iter=5其它参数见gensim库,执行代码为:gensim.models.Word2Ve...

超详细Seaborn绘图 ——(二)boxplot & boxenplot

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱形图最大的优点就是不受异常值的影响(异常值也称为离群值),可以以一种相对稳定的方式描述数据的离散分布情况。目录一、基础概念二、boxplot(一)语法(二)参数详解(三)实例一、基础概念一个boxplot主要包含六个数...

超详细Seaborn绘图 ——(五)pointplot

pointplot,如其名,就是点图。点图代表散点图位置的数值变量的中心趋势估计,并使用误差线提供关于该估计的不确定性的一些指示。点图比条形图在聚焦一个或多个分类变量的不同级别之间的比较时更为有用。点图尤其善于表现交互作用:一个分类变量的层次之间的关系如何在第二个分类变量的层次之间变化。重要的一点是点图仅显示平均值(或其他估计值),但在许多情况下,显示分类变量的每个级别的值的分布可能会带有更多..

常用的大数据分析方法

本文主要讲述数据挖掘分析领域中,最常用的四种数据分析方法:描述型分析、诊断型分析、预测型分析和指令型分析。当刚涉足数据挖掘分析领域的分析师被问及,数据挖掘分析人员最重要的能力是什么...

到底了