简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
详解TF-IDF
IF-IDF概念TF-IDF是NLP中常用的方法,也比较经典。IF-IDF的思想:如果一个词在文档中出现了很多次,但是这个词在其它文档中出现的次数很少,则这个词对这篇文档很重要,在一定程度上可以代表这个文档的关键信息。所以在网页搜索、关键词提取中常用到IF-IDF。TF-IDF就是tf−idf(t,d)=tf(t,d)×idf(t)tf-idf(t,d)=tf(t,d) \times idf(..
分布式机器学习dask
文章目录Dask组成特性Install Dask分布式机器学习DaskDask是一个数据分析的并行计算的框架。已经集成了现有的框架,比如:numpy,pandas,scikit-learn,xgboost,lightGBM等API与已有框架的API一致可以扩展到上千个节点,也可以在笔记本上使用有低阶API可供用户定制化组成动态任务调度(Dynamic tas...
到底了