logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

文本分类任务和命名实体识别任务进行多任务学习中的问题

与标准的单任务相比,在学习共享表示的同时训练多个任务有两个主要挑战:Loss Function(how to balance tasks):多任务学习的损失函数,对每个任务的损失进行权重分配,在这个过程中,必须保证所有任务同等重要,而不能让简单任务主导整个训练过程。手动的设置权重是低效而且不是最优的,可能会出现第一个任务已经训练的很好了,然而第二个任务还完全没有收敛。

#机器学习#深度学习#自然语言处理 +1
记录篇:【百面机器学习】第一章.特征工程---组合特征

场景描述上一节介绍了如何利用降维方法来减少两个高维特征组合后需要学习的参数。但是在很多实际问题中,我们常常需要面对多种高维特征。如果简单地两两组合,依然容易存在参数过多、过拟合等问题,而且并不是所有的特征组合都是有意义的。因此,需要一种有效的方法来帮助我们找到应该对哪些特征进行组合。本节介绍一种基于决策树的特征组合寻找方法以点击预测问题为例,假设原始输入特征包含年龄、性别、用户类型(试用期、付费)

#机器学习#人工智能
记录篇:【百面机器学习】第五章.非监督学习---自组织映射神经网络

自组织映射神经网络(Self-Organizing Map,SOM)是无监督学习方法中一类重要方法,可以用作聚类、高维可视化、数据压缩、特征提取等多种用途。问题1 自组织映射神经网络是如何工作的?它与K均值算法有何区别?自组织映射神经网络本质上是一个两层的神经网络,包含输入层和输出层(竞争层)。输入层模拟感知外界输入信息的视网膜,输出层模拟做出响应的大脑皮层。输出层中神经元的个数通常是聚类的个数,

#机器学习#神经网络#深度学习
记录篇:【百面机器学习】第一章.特征工程---组合特征

场景描述上一节介绍了如何利用降维方法来减少两个高维特征组合后需要学习的参数。但是在很多实际问题中,我们常常需要面对多种高维特征。如果简单地两两组合,依然容易存在参数过多、过拟合等问题,而且并不是所有的特征组合都是有意义的。因此,需要一种有效的方法来帮助我们找到应该对哪些特征进行组合。本节介绍一种基于决策树的特征组合寻找方法以点击预测问题为例,假设原始输入特征包含年龄、性别、用户类型(试用期、付费)

#机器学习#人工智能
记录篇:【百面机器学习】第七章.采样---采样的作用

举例说明采样在机器学习中的应用采样本质上是对随机现象的模拟,根据给定的概率分布,来模拟产生一个对应的随机事件。采样可以让人们对随机事件及其产生过程有更直观的认识。例如,通过对二项分布的采样,可以模拟“抛硬币出现正面还是反面”这个随机事件,进而模拟产生一个多次抛硬币出现的结果序列,或者计算多次抛硬币后出现正面的频率。另一方面,采样得到的样本集也可以看作是一种非参数模型,即用较少量的样本点(经验分布)

#机器学习#概率论#人工智能
记录篇:【百面机器学习】第二章.模型评估---ROC曲线

问题1 什么是ROC曲线?ROC曲线是Receiver Operating Characteristic Curve的简称,中文名为“受试者工作特征曲线”。ROC曲线源于军事领域,而后在医学领域应用甚广,“受试者工作特征曲线”这一名称也正是来自于医学领域。ROC曲线的横坐标为假阳性率(False Positive Rate,FPR);纵坐标为真阳性率(True Positive Rate,TPR)

#机器学习#人工智能#算法
记录篇:【百面机器学习】第二章.模型评估---ROC曲线

问题1 什么是ROC曲线?ROC曲线是Receiver Operating Characteristic Curve的简称,中文名为“受试者工作特征曲线”。ROC曲线源于军事领域,而后在医学领域应用甚广,“受试者工作特征曲线”这一名称也正是来自于医学领域。ROC曲线的横坐标为假阳性率(False Positive Rate,FPR);纵坐标为真阳性率(True Positive Rate,TPR)

#机器学习#人工智能#算法
记录篇:【百面机器学习】第七章.采样---常见的采样方法及高斯分布的采样

对于一个随机变量,通常用概率密度函数来刻画该变量的概率分布特性。具体来说,给定随机变量的一个取值,可以根据概率密度函数来计算该值对应的概率(密度)。反过来,也可以根据概率密度函数提供的概率分布信息来生成随机变量的一个取值,这就是采样。因此,从某种意义上来说,采样是概率密度函数的逆向应用。与根据概率密度函数计算样本点对应的概率值不同,采样过程往往没有那么直接,通常需要根据待采样分布的具体特点来选择合

#机器学习#概率论#人工智能
记录篇:【百面机器学习】第五章.非监督学习---自组织映射神经网络

自组织映射神经网络(Self-Organizing Map,SOM)是无监督学习方法中一类重要方法,可以用作聚类、高维可视化、数据压缩、特征提取等多种用途。问题1 自组织映射神经网络是如何工作的?它与K均值算法有何区别?自组织映射神经网络本质上是一个两层的神经网络,包含输入层和输出层(竞争层)。输入层模拟感知外界输入信息的视网膜,输出层模拟做出响应的大脑皮层。输出层中神经元的个数通常是聚类的个数,

#机器学习#神经网络#深度学习
    共 11 条
  • 1
  • 2
  • 请选择