logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

淘宝详情页分发推荐算法总结:用户即时兴趣强化

其中,全网流量分发场景主要包括详情页底部信息流(邻家好货),主图横滑(新增),加购弹层(新增)。这些场景打破了商家私域画地为牢的局面,充分地提升了私域全网分发的能效。当然为了兼顾商家利益,这些场景将分为两个部分(同店内容推荐模块和跨店内容推荐模块)。进入详情页是用户主动发起的行为,因而用户对于当前页面的主商品有着较强的兴趣聚焦。主商品的信息能够帮助我们快速地定位用户的即时兴趣,这对于推荐算法来说是

文章图片
#推荐算法#算法#机器学习
大众点评搜索基于知识图谱的深度学习排序实践

2018年下半年,点评搜索完成了从树模型到大规模深度学习排序模型的全面升级。团队在深度学习特征工程、模型结构、优化目标以及工程实践上都进行了一些探索,在核心指标上取得了较为显著的收益。当然,未来依然有不少可以探索的点。在特征层面,大量知识图谱提供的标签信息尚未充分挖掘。从使用方式上看,简单以文本标签的形式接入,损失了知识图谱的结构信息,因此,Graph Embedding也是未来需要尝试的方向。同

文章图片
#知识图谱#深度学习#人工智能
神经网络优化算法如何选择Adam,SGD

链接:https://blog.csdn.net/u014381600/article/details/72867109/之前在tensorflow上和caffe上都折腾过CNN用来做视频处理,在学习tensorflow例子的时候代码里面给的优化方案默认很多情况下都是直接用的AdamOptimizer优化算法,如下:optimizer = tf.train.AdamOptimizer(le...

Qwen 3 技术解析:通过强化学习和思维模式融合提升模型对齐

今天为大家分享近期阿里发布的Qwen3技术报告,特别是Qwen3如何通过一系列精密的后训练(Post-training)过程,从一个强大的基础模型,蜕变成一个更加智能、灵活、且与人类偏好高度对齐的助手。这就像是给大模型装上了“智慧大脑”和“沟通桥梁”的升级过程。

#语言模型
Linux下hadoop完全分布式配置总结

这段时间一直在配置hadoop系统,搞了半个多月,昨天听凯子说他配成功过,然后给我推荐了他的写的博客,今天按照他配置的过程,终于配置成功了,首先感谢凯子帅哥,以后要注意多和朋友们交流,这样就可以少走很多弯路。    凯子帅哥的博客地址(http://www.zhenv5.com/?s=hadoop&x=0&y=0),可以到他的zhenv5网站查看原文。    下面将我的配置过程,和配置不成

#hadoop#linux#mapreduce +2
神经网络正则化(1):L1/L2正则化

转自:https://zhuanlan.zhihu.com/p/35893078在神经网络出现high variance也就是overfitting的时候,regularization(正则化)是一个很常用的方法。现在应用最为广泛的包括两种regularization方式:L1/L2 regularizationdropout regularization其中本篇介绍L1/L2 r...

PPO算法原理

核心目标:解决传统策略梯度 “更新幅度不可控” 的问题,通过 Clip 操作限制新 / 旧策略的差异;稳定关键:用 GAE 计算优势函数,平衡方差和偏差,让训练更稳定;效率关键:多轮 Epoch 训练同一批数据,提升数据利用率;实现核心:Clip 操作(限制策略更新比例)+ 同时优化策略 / 值函数 + 熵奖励(鼓励探索);RLHF 适配:奖励由 “人类反馈(奖励模型)+ KL 惩罚” 组成,避免

#算法
rankerMixer为什么能提升系统的MFU

通过无参数 Token Mixing、大 GEMM 主导的 PFFN、语义化分词的架构创新,从根源消除传统模型的碎片化计算和显存密集型操作,让模型计算天然适配 GPU 的并行特性;再通过核融合、参数量与 FLOPs 解耦、资源瓶颈转移的工程优化,将 GPU 的计算资源从显存 IO 的闲置状态中释放,最终实现模型从 “显存受限” 到 “计算受限” 的转变,让 MFU 实现 10 倍的跨越式提升。

#语言模型
搜索整体架构

搜索按照模块划分,整体分为三个主要部分,分别是离线数据挖掘、召回系统、排序系统。离线数据挖掘负责离线商品等成分提取等功能,包括商品的实体词挖掘,类目预测,属性挖掘,以及商品title seo优化和网格拓品等。

文章图片
#搜索引擎
神经网络优化算法如何选择Adam,SGD

链接:https://blog.csdn.net/u014381600/article/details/72867109/之前在tensorflow上和caffe上都折腾过CNN用来做视频处理,在学习tensorflow例子的时候代码里面给的优化方案默认很多情况下都是直接用的AdamOptimizer优化算法,如下:optimizer = tf.train.AdamOptimizer(le...

    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择