
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
模型效果上限预估、分类模型Bad Case分析方法
模型效果上限预估、分类模型Bad Case分析方法给定训练和测试数据集,训练某个二分类模型(如,GBDT算法),我们通过交叉验证的方法得到了一组最优超参数以及对应的最优模型,但在测试集上这个模型仍有一定的误差率,也就说模型的预测结果存在一定数量的bad case。那么,目前的模型逼近了效果的上限了吗? 这些bad case有可能被解决吗?如果可以,该如何解决呢?回答这些问题的前提条件是样本和特征已
多任务学习算法在推荐系统中的应用
本文概要讲述了多任务学习的定义、动机和一般方法,概要介绍了目前主流的几种多目标排序模型。并结合电商平台商品详情页的业务场景具体介绍了如何构建样本,如何做特征工程。并且推荐基于开源的面向工业界的EasyRec推荐算法训练框架来构建做算法的训练和评估。至于模型服务的部署,每家公司的平台各不相同,就不详细介绍了。

GBDT算法的特征重要度计算
基于树的集成算法还有一个很好的特性,就是模型训练结束后可以输出模型所使用的特征的相对重要度,便于我们选择特征,理解哪些因素是对预测有关键影响,这在某些领域(如生物信息学、神经系统科学等)特别重要。本文主要介绍基于树的集成算法如何计算各特征的相对重要度。
GBDT算法原理深入解析
本文对GBDT算法原理进行介绍,从机器学习的关键元素出发,一步一步推导出GBDT算法背后的理论基础,读者可以从这个过程中了解到GBDT算法的来龙去脉。对于该算法的工程实现,本文也有较好的指导意义,实际上对机器学习关键概念元素的区分对应了软件工程中的“开放封闭原则”的思想,基于此思想的实现将会具有很好的模块独立性和扩展性。
到底了







