logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

百度paddle ernie 实战

背景:最近百度 paddle ernie非常火,而且公司打算使用paddle作为机器学习的框架,所以研究ernie用于文本识别,主要用于文本分类任务,根据资讯的title来做成很多二分类器,比如判定这个资讯是不是XXX标签。下面是实战的记录,已经调通ernie文本分类的代码,详细记录在这里。#############下面的版本是在linux 环境上是可以运行成功的https://g...

广告行业中那些趣事系列16:NLPer一定要知道的BERT文本分类优化策略及原理

本篇一共7100个字摘要:本篇主要分享了项目实践中的BERT文本分类优化策略和原理。首先是背景介绍及优化方向,其中优化方向主要分成从数据层面优化和模型层面优化;然后通过实验的方式重点分析...

#大数据#编程语言#机器学习 +2
广告行业中那些趣事系列24:从理论到实践解决文本分类中的样本不均衡问题...

摘要:本篇主要从理论到实践解决文本分类中的样本不均衡问题。首先讲了下什么是样本不均衡现象以及可能带来的问题;然后重点从数据层面和模型层面讲解样本不均衡问题的解决策略。数据层面主要通过欠采...

#大数据#算法#编程语言 +2
广告行业中那些趣事系列2:BERT实战NLP文本分类任务(附github源码)

微信公众号:数据拾光者。愿结交更多的小伙伴,一同走人生路。摘要:上一篇广告中那些趣事系列1:广告统一兴趣建模流程,我们了解了如何为广告主圈人群以及如何刻画用户的兴趣度。要想给用户打标签,我们需要构建数据源和标签的关联,也就是item-tag。针对数量较少的app数据源我们可以使用人工打标的方式来识别,但是对于news、用户query等数量较多的数据源则需要通过机器学习模型来进行打标。实际项...

#自然语言处理
广告行业中那些趣事系列53:多模态学习在CTR预估模型中的应用实践

导读:本文是“数据拾光者”专栏的第五十三篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇分享了多模态学习在CTR预估模型中的应用实践及效果展示,对于想要将多模态学习应用到CTR预估模型中的小伙伴可能有所帮助。欢迎转载,转载请注明出处以及链接,更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏:数据拾光者公众号:数据拾光者摘要:本篇分享了多模态...

#大数据#编程语言#python +2
广告行业中那些趣事系列56:超实用的多模态学习模型VILT源码实践

导读:本文是“数据拾光者”专栏的第五十六篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍了多模态学习模型VILT几个实用的源码实践,对于希望将VILT模型应用到业务实践的小伙伴可能有帮助。欢迎转载,转载请注明出处以及链接,更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏:数据拾光者公众号:数据拾光者摘要:本篇主要介绍了多模态学习模型...

#python#java#人工智能 +2
广告行业中那些趣事系列21:从理论到实战BERT知识蒸馏

导读:本文是“数据拾光者”专栏的第二十一篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要分享从理论到实战知识蒸馏,对知识蒸馏感兴趣的小伙伴可以一起沟通交流。欢迎转载...

#大数据#编程语言#python +2
自然语言处理三大特征抽取器(CNN/RNN/TF)比较

转载https://zhuanlan.zhihu.com/p/54743941放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较一个是Bert这种两阶段的模式(预训练+Finetuning)必将成为NLP领域研究和工业应用的流行方法;第二个是从NLP领域的特征抽取器角度来说,Transformer会逐步取代RNN成为最主流的的特征抽取器。目...

广告行业中那些趣事系列63:使用chatgpt类大模型进行文本分类任务

导读:本文是“数据拾光者”专栏的第六十三篇文章,这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍了使用chatgpt类大语言模型进行文本分类任务,对于希望使用chatgpt类大语言模型上进行数据标注、文本分类和关键词抽取等任务感兴趣的小伙伴可能有帮助。欢迎转载,转载请注明出处以及链接,更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏:数据拾光者公众号:数据拾光者摘要

#分类#数据挖掘#人工智能 +1
深度学习网络调参技巧

https://zhuanlan.zhihu.com/p/24720954?utm_source=zhihu&utm_medium=social深度学习网络调参技巧一、好的实验环境是成功的一半由于深度学习实验超参众多,代码风格良好的实验环境,可以让你的人工或者自动调参更加省力,有以下几点可能需要注意:1.将各个参数的设置部分集中在一起。如果参数的设置分布在代码的各个地方,那么修...

    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择