logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

BM25算法与TF-IDF

BM25和tf-idf算法

文章图片
#机器学习
机器学习,VC维理解

VC维度定义:对于一个指示函数集,如果存在h个数据样本能够被函数集中的函数按所有可能的2^h 种形式分开 ,则称函数集能够把h个数据样本打散(shatter)。函数集的VC维就是能打散的最大数据样本数目h。若对任意数目的数据样本都有函数能将它们shatter,则函数集的VC维为无穷大。VC维在机器学习中的意义还是很大的,它是统计学习理论用来衡量函数集性能的一种指标——VC维越大,则学习过程越复杂。

#机器学习
机器学习预处理的一些方法

数据预处理:https://www.jianshu.com/p/ffbf2c0d0c94过滤法方差过滤:排除数值波动小的,from sklearn.feature_selection import VarianceThreshold相关性过滤卡方检验的本质是推测两组数据之间的差异,检验原假设是”两组数据是相互独立的”。卡方检验返回卡方值和P值两个统计量,可以根据P值筛选,p<=0.05或0.

#机器学习
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择