logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

详解TF-IDF

IF-IDF概念TF-IDF是NLP中常用的方法,也比较经典。IF-IDF的思想:如果一个词在文档中出现了很多次,但是这个词在其它文档中出现的次数很少,则这个词对这篇文档很重要,在一定程度上可以代表这个文档的关键信息。所以在网页搜索、关键词提取中常用到IF-IDF。TF-IDF就是tf−idf(t,d)=tf(t,d)×idf(t)tf-idf(t,d)=tf(t,d) \times idf(..

#自然语言处理#机器学习
分布式机器学习dask

文章目录Dask组成特性Install Dask分布式机器学习DaskDask是一个数据分析的并行计算的框架。已经集成了现有的框架,比如:numpy,pandas,scikit-learn,xgboost,lightGBM等API与已有框架的API一致可以扩展到上千个节点,也可以在笔记本上使用有低阶API可供用户定制化组成动态任务调度(Dynamic tas...

到底了