
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
1、取消全局验证:该问题主要是常见于爬虫时使用request访问网站以及在机器学习中常常在线请求一些数据集合时候发生。该错误的主要原因就是SSL的安全证书的原因,mac电脑下十分常见该类错误。直接粘贴以下代码即可。import sslssl._create_default_https_context = ssl._create_unverified_context2、其它靠谱参考方式彻底解决Mac
一、交叉验证什么是交叉验证?将拿到的训练数据分为训练和验证集。例如将训练数据分成4份,其中一份作为验证集。然后经过4组的测试,每次都更换不同的验证集,即得到4组模型的结果,取平均值作为最终结果,并称为4折交叉验证。训练集:训练集+验证集测试集:测试集为什么需要交叉验证?为了让被评估的模型更加准确可信二、超参数搜索-网格搜索(Grid Search)什么是参数搜索?通常情况下,有很多参数是需要手动指
随机森林是一种集成学习方法一、什么是集成学习方法?集成学习通过建立几个模型组合的方法来解决单一预测问题。他的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类作出的预测。二、什么是随机森林?在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。例如,如果你训练了5个树,其中有4个树的结果是Tru
计算一个指定的文件和一个指定的文件夹下面每一个文件的相似度计算一个文件下任意两个文件的相似度。

K Nearest Neighbor算法这个算法是机器学习里面比较经典的算法,也叫做KNN算法,总体来说KNN算法是相对比较容易理解的算法算法定义:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别距离公式(一般要处理数据如标准化后再计算距离)欧式距离曼哈顿距离明可夫斯基距离KNN算法中K取值的分析K取的过小,容易受到异常点的影响;K取
特征预处理(归一化+标准化)APIsklearn库下的preprocessingsklearn.preprocessing一、归一化归一化的原因:使得各特征单位不再收到单位或本身差异大小的影响,使得各单位具有相等的地位归一化的定义:通过对原始数据进行变化把数据映射到指定的区间中归一化的公式:百度百科归一化APIsklearn.preprocessing.MinMaxScaler(feature_r
1、认识决策树?决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,就是利用这类结构分割数据的一种分类学习方法。是帮助我们进行高效决策分析的一种方法。2、信息论基础(信息熵、信息增益)信息:消除随机不定性的东西(信息论创始人说的:香农)信息的衡量:使用信息熵,反应信息量的多少信息熵的定义决策树的划分依据之一 – 信息增益3、决策树APIsklearn.tree.Decisio
使用go-redis作为连接工具。
如果你已经是root用户,则无需执行su root输入密码即可。







