logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

华为FinalMLP

Two-Stream model:因为一个普通的MLP网络不足以学到丰富的特征交叉信息,因此大家提出了很多实用MLP和其他专用网络结合来学习。MLP是隐式地学习特征交叉,当前很多工作主要在另外一个stream中显式的增强特征交叉。本文提出的两个stream都用MLP网络,训练的好一样能达到惊人的效果。而且提出的可插拔式使用的特征选择层和交叉融合层,可以得到性能更强的two-stream MLP模型

文章图片
#深度学习#人工智能#神经网络
阿里用户序列建模ETA

长序列用户建模的两阶段方法存在两个问题,首先是目标不一致,第一阶段目的是找到和目标物料相似的用户序列行为,第二阶段是尽可能的准确建模点击率;其次,第一阶段和第二阶段的更新频率不同,第一阶段是离线构建索引,然后导入到线上,第二阶段是参与在线训练。受Reformer的启发,我们提出了一种称为 ETA(End-to-end Target Attention)可以大大降低训练和推理成本,并端到端训练长期用

文章图片
#深度学习#人工智能
优势特征蒸馏:阿里PFD

ctr&cvr预估任务中有很多非常有区分性的特征没法使用,比如用户点击之后的互动时长、点击之后的一些页面动作信息,因为只有离线训练的时候能拿到,线上预估的时候是拿不到的,为了保持线上和线下的一致性,这些“优势特征”(Privileged Features)就会被忍痛割爱舍弃掉。通过蒸馏的方式,teacher模型的特征输入包含了优势特征,teacher模型和student模型结构一样,只是特征输入不

文章图片
#机器学习
阿里用户序列建模SIM

MIMN是工业解决方案中第一个可以对用户序列长度达到1000的数据进行建模。但MIMN无法精确捕获给定用户兴趣的特定候选项目时,长度为用户行为序列进一步增加,比如增加10倍或更多。本文提出的基于搜索的兴趣模型(SIM)通过两个级联搜索单元提取用户兴趣:(i)泛搜单元GSU(General Search Unit)负责从原始序列泛搜任意长的顺序行为数据,并获得相关的子用户行为序列(SBS)(ii)*

文章图片
#深度学习
StringUtils.isNumeric判断是否是数字字符串

StringUtils.isNumeric判断是否是数字字符串org.apache.commons.lang3.StringUtils字符串工具类StringUtils能够很方便的处理Java字符串问题,简直是Java字符串的一大法宝可以记录下常用的功能,即便对于字符串对象为null,也是轻松处理IsEmpty/IsBlank - checks if a String contains t...

Python绘制频率分布直方图

Python绘制频率分布直方图项目中在前期经常要看下数据的分布情况,这对于探究数据规律非常有用。概率分布表示样本数据的模样,长的好不好看如果有图像展示出来就非常完美了,使用Python绘制频率分布直方图非常简洁,因为用的频次非常高,这里记录下来。还是Python大法好,代码简洁不拖沓~如果数据取值的范围跨度不大,可以使用等宽区间来展示直方图,这也是最常见的一种;如果数据取值范围比较野,也可以自..

Java遍历Map效率对比

Java遍历Map效率对比Java 中Map容器的遍历有多种方式,但是不同的方式效率会大有不同,以前没有注意这些细节,随意使用遍历方式在本地可能没有什么影响,但是在项目在高频使用需要特别注意,尽量使用高效的方式。首先,Map.Entry<K,V>是可以包含了Key和Value的,keySet包含了所有的Key,再使用get方法可以拿到对应的Value;所以包含Key和Value内容..

Linux使用Except实现自动登录

Linux使用Except实现自动登录在实际项目中,需要经常登录不同的服务器,这样的频繁的登录操作每次都需要输入密码,每次这样的输入非常的烦人,如果有个脚本做这个事情就好多了,在网上发现Linux有个Except可以实现这个功能,这个好东西简直拯救了一大票懒人~Except主要进行自动化的交互,Except能够模拟用户的输入,也可以读取标准输出,这非常适合需要用户输入的场景。这里假设我有三台机..

IDEA使用谷歌代码规范格式化代码

谷歌代码格式化规范代码格式化风格非常重要,代码格式和人穿衣服一样,如果代码乱糟糟的,就像人穿衣服一样乱糟糟的,看不下去要呕吐的感觉。市面上有几种非常优秀的代码格式化标准,这里选用谷歌的代码格式化标准。谷歌的代码规范放在git仓库上,最好拉取文件到本地,直接载入到编辑器中,git地址 https://github.com/google/styleguide/blob/gh-pages/intel..

#代码规范
到底了