logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

COBRA详解

稀疏ID可以唯一表示item,有很好的区分性,但丧失了对item的细粒度信息刻画。纯文本可以准确可以item属性,但构造成prompt太长,套入到LLM中会导致资源消耗过大。那么如何结合两者的优点呢?COBRA首先根据codebook生成item的稀疏ID,该ID可以理解为item的大类别。既不过于精细,像unique id,又不过于宽泛。然后将ID序列输入到Transformer Decoder

文章图片
生成式召回-TIGER范式

TIGER是第一篇将Generative Retrieval 自回归生成方式应用于推荐系统的工作;它通过Semantic ID 和 Seq2Seq Transformer,突破embedding + ANN的传统限制;在冷启动、多样性、效率和泛化能力上展现强优势;适用于大规模推荐场景,尤其是content-rich、item海量、频繁上线新品的平台。

新一代粗排系统COLD

为了让粗排支持交叉特征来提升模型性能,同时又为了降低引入交叉特征、复杂模型所带来的预估延迟和资源消耗,阿里团队提出了COLD,在模型效果和算力间取得了平衡。more。

文章图片
毫米波雷达&激光雷达

毫米波雷达是**“务实的功能性传感器”**,性价比高,全天候可靠,尤其擅长测速。激光雷达是**“精确的建模型传感器”**,能构建高精地图,是高级别自动驾驶的“眼睛”,但成本高且受天气制约。它们是智能系统感知世界的两种互补技术,共同确保了车辆或机器人在复杂环境下的安全运行。

ipynb导出为markdown

【代码】ipynb导出为markdown。

#python
利用Github Action来自动化部署Hexo博客

这两天尝试了使用Github Action来自动化部署博客,踩了一些坑,在此记录一下。新建仓库存放博客源文章的仓库(Source Repo),命名随意存放编译后生成的静态文件的仓库(Page Repo),命名username.github.io配置部署密钥利用 ssh-keygen 来生成公钥和私钥:私钥放于Source仓库的 Settings -> Secrets -> Action

本地机器ssh免密登录win10服务器

上一篇配置好了OpenSSH,这一次准备免密登录win10的,本机的公钥也写到win10的 authorized_keys 中了,但是ssh登录还是需要密码。在这里,还需要修改一个文件:C:\ProgramData\ssh\sshd_config :# Match Group administrators#AuthorizedKeysFile __PROGRAMDATA__/ssh/adminis

#ssh#服务器#运维
模型训练的显存占用分布

训练过程中,显存消耗主要有模型参数、梯度、optimizer状态值和中间激活值。

文章图片
大模型微调方法

下面是一些参数高效的微调大模型方法:more。

文章图片
#python#人工智能#算法
深度学习代码编写及调参经验

数据预处理好之后可以保存成pkl文件,这样后面多次运行程序的时候,可以直接加载。省的每次都要处理浪费时间tag2id 列完之后可以用一行代码转换成 id2tag:id2tag = {num: label for label, num in tag2id.items()}...

    共 30 条
  • 1
  • 2
  • 3
  • 请选择