
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
迁移学习的目标是从一个或者多个源领域任务中提取有用知识并将其用在新的目标任务上,本质上就是知识的迁移再利用。迁移学习的问题关键就是要解决三个问题,什么时候迁移,什么可以迁移,如何迁移。迁移学习的本质就是知识的再利用,数学上,迁移学习包含“域”和“任务”两个因素。
迁移学习的目标是从一个或者多个源领域任务中提取有用知识并将其用在新的目标任务上,本质上就是知识的迁移再利用。迁移学习的问题关键就是要解决三个问题,什么时候迁移,什么可以迁移,如何迁移。迁移学习的本质就是知识的再利用,数学上,迁移学习包含“域”和“任务”两个因素。
PCA:主成分分析,一种常用的数据分析方法,不管是在机器学习还是数据挖掘中都会用到。PCA主要通过求数据集的协方差矩阵最大的特征值对应的特征向量,由此找到数据方差最大的几个方向,对数据达到降维的效果,将一个n维的向量降低到d维,其中d<n。本文主要从方差最大化理论解释PCA的实现过程。
TradaBoost算法由来已久,现在也有各种针对算法的该进,本文只讨论最初的算法。1.迁移学习 传统的机器学习的模型都是建立在训练数据和测试数据服从相同的数据分布的基础上。典型的比如有监督学习,我们可以在训练数据上面训练得到一个分类器,用于测试数据。但是在许多的情况下,这种同分布的假设并不满足,有时候我们的训练数据会过期,而重新去标注新的数据又是十分昂贵的。这个时候如果丢弃训练数据又是
不正之处,欢迎指正。 KNN算法称为K近邻分类算法,是最简单的分类器,KNN算法从训练集中找到和测试数据距离最近的K个记录,然后根据这K个记录的标记来决定测试实例的最终标记。MapReduce作为一种大数据环境下的计算模型,在分布式计算中具有其独特的优势,本文主要在hadoop框架下面实现KNN算法。 实验环境:centos6.5+hadoop2.2.0







