
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
迁移学习,简单的说,就是能让现有的模型算法稍加调整即可应用于一个新的领域和功能的一项技术。这个概念目前在机器学习中其实比较少见,但其实它的潜力可以相当巨大。杨强教授在刚刚结束的CCF-GAIR上的演讲中曾提到一个愿景——利用迁移学习,即使是自身没有条件获得大量训练数据的小公司也可以按照自己的需要应用大公司训练出来的模型,从而普及AI的应用。在目前大家都在努力提高人工智能应用通用性的大背景下,迁移学
背景在这个主题中,我们将介绍回归模型拟合数据的效果。每当用线性模型拟合数据做完之后,我们应该问的第一个问题就是“拟合的效果如何?”本主题将回答这个问题。线性模型我们还用上一主题里的lr对象和boston数据集。lr对象已经拟合过数据,现在有许多方法可以用。from sklearn import datasetsboston = datasets.load_boston()from sklearn
贝叶斯岭回归在岭回归主题中,我们介绍了岭回归优化的限制条件。我们还介绍了相关系数的先验概率分布的贝叶斯解释,将很大程度地影响着先验概率分布,先验概率分布通常均值是0。背景岭回归和LASSO用贝叶斯观点来解释,与频率优化观点解释相反。scikit-learn只实现了贝叶斯岭回归,我们将对比两种回归算法。准备模拟数据首先,我们创建一个回归数据集:from sklearn.datasets import
简介sklearn.datasets 包提供了一些小的toy数据集。为了评估数据特征(n_samples,n_features)的影响,可以控制数据的一些统计学特性,产生人工数据。这个包提供一些接口,来获取真实的机器学习社区常用于基准算法的大数据集。常见的dataset APIsklearn对于不同的数据类型提供三种数据接口。- sample images是最简单的接口dataset 产生函数
简介sklearn.datasets 包提供了一些小的toy数据集。为了评估数据特征(n_samples,n_features)的影响,可以控制数据的一些统计学特性,产生人工数据。这个包提供一些接口,来获取真实的机器学习社区常用于基准算法的大数据集。常见的dataset APIsklearn对于不同的数据类型提供三种数据接口。- sample images是最简单的接口dataset 产生函数
背景:优化岭回归参数alpha当你使用岭回归模型进行建模时,需要考虑Ridge的alpha参数。例如,用OLS(普通最小二乘法)做回归也许可以显示两个变量之间的某些关系;但是,当alpha参数正则化之后,那些关系就会消失。做决策时,这些关系是否需要考虑就显得很重要了。模型参数优化用交叉检验(cross validation)完成。在后面的主题中,还会有更简便的方式实现这些,但是这里我们一步一步来实
背景梯度提升回归(Gradient boosting regression,GBR)是一种从它的错误中进行学习的技术。它本质上就是集思广益,集成一堆较差的学习算法进行学习。有两点需要注意:- 每个学习算法准备率都不高,但是它们集成起来可以获得很好的准确率。- 这些学习算法依次应用,也就是说每个学习算法都是在前一个学习算法的错误中学习准备模拟数据我们还是用基本的回归数据来演示GBR:impor
简介首先简要介绍一下AC自动机:Aho-Corasick automation,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一。一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章,让你找出有多少个单词在文章里出现过。要搞懂AC自动机,先得有模式树(字典树)Trie和KMP模式匹配算法的基础知识。AC自动机算法分为3步:构造一棵Trie树,构造失败指针和模式匹配过程。多模匹配
矢量对元素求导矢量对元素求导,相当于把矢量里的每一个元素对元素求导,结果的形式还是矢量的形式。行向量对元素求导列向量对元素求导矩阵对元素求导元素对矢量求导元素对矢量求导,相当于元素和矢量里的每一个元素求一次导,结果的形式和矩阵的形式相同。元素对行向量求导元素对列向量求导元素对矩阵求导矢量对矢量求导矢量对矢量的求导要采用逐层展开的方式。先将一个矢量看成一个元素,然后采用前面元素和矢量的运算法则。行向
背景在这个主题中,我们将介绍回归模型拟合数据的效果。每当用线性模型拟合数据做完之后,我们应该问的第一个问题就是“拟合的效果如何?”本主题将回答这个问题。线性模型我们还用上一主题里的lr对象和boston数据集。lr对象已经拟合过数据,现在有许多方法可以用。from sklearn import datasetsboston = datasets.load_boston()from sklearn







