logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM-agent 的 Planning 综述

本文为阅读论文 Understanding the planning of LLM agents: A survey 后的论文理解,仅自留使用,欢迎交流。

#算法#机器学习#人工智能 +2
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文阅读

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文阅读,自留使用,欢迎交流

文章图片
#论文阅读#算法#机器学习 +2
论文Heterogeneous Graph Transformer(HGT)阅读笔记

提出异构图 Transformer 模型(HGT)设计元关系感知的异构注意力机制引入相对时间编码提出 HGSampling提出归纳式时间戳分配方法。

文章图片
#论文阅读#学习方法#深度学习 +1
【推荐系统14】数据分析:以阿里天池新闻推荐为例学习

训练集和测试集的用户id没有重复,也就是测试集里面的用户模型是没有见过的训练集中用户最少的点击文章数是2, 而测试集里面用户最少的点击文章数是1用户对于文章存在重复点击的情况, 但这个都存在于训练集里面同一用户的点击环境存在不唯一的情况,后面做这部分特征的时候可以采用统计特征用户点击文章的次数有很大的区分度,后面可以根据这个制作衡量用户活跃度的特征文章被用户点击的次数也有很大的区分度,后面可以根据

文章图片
#数据分析#数据挖掘#学习 +2
简述深度学习中的四种数据并行方法(DP,DDP,TP,PP)

不足:每个 worker 必须同时存储并运行的各个 micro-batch 的激活值,导致流水线第一阶段的激活内存与单个 mirco-batch 的总激活内存大致相同。流水线并行的核心思想是:在模型并行的基础上,进一步引入数据并行的办法(将模型的各层划分为可以并行处理的阶段),即把原先的数据再划分成若干个batch,送入GPU进行训练。优势:流水线并行减少的显存与流水线的阶段数成正比,这使模型的大

#论文阅读#机器学习#深度学习 +1
LLM-agent 的 Planning 综述

本文为阅读论文 Understanding the planning of LLM agents: A survey 后的论文理解,仅自留使用,欢迎交流。

#算法#机器学习#人工智能 +2
【推荐系统13】生成式推荐

生成式召回:无需预构建索引,直接通过模型生成与查询相关的候选结果本节讨论三个主要内容:一是生成式召回,延续SASRec的思路但在输入和输出上进行深度创新;二是生成式排序,将生成范式引入传统的排序阶段;三是端到端统一生成,试图用单一模型完成从召回到排序的全流程。

文章图片
#深度学习#人工智能#python +1
Qwen2.5技术报告解读:Qwen2.5 Technical Report

Qwen2.5技术报告解读,自留使用,欢迎交流。

文章图片
#算法#机器学习#学习方法 +2
OneSearch:A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commer论文笔记

关键词增强的层次量化编码(KHQE)模块:在保持强查询-商品相关性约束的前提下,同时保留层次化语义和商品的区分性属性,利用的是RQ-OPQ(残差量化+优化乘积量化)的组合方案。RQ负责层次化语义:第一层编码大类(服装),第二层编码子类(连衣裙),第三层编码细节(颜色、款式)OPQ负责独特特征:保留每个商品的独特属性,避免信息损失关键词增强:通过NER识别18种结构化属性(品牌、材质、风格等),确保

文章图片
#论文阅读#人工智能#推荐算法 +1
【推荐系统8】多场景建模

但是在多场景建模中,样本只在相同的场景内才满足独立同分布,多个场景混合的样本得到的统计量会忽略了不同场景独有的分布差异。1. EPNet:场景感知的嵌入个性化在共享的底层 Embedding 的基础上,引入一个带有场景先验信息的门控(Gate)机制,以极低的额外参数量,实现 Embedding 层的场景差异化和个性化。本节讨论基于多塔结构的多场景建模方案,构建物理隔离的参数塔,分而治之,为不同场景

#深度学习#人工智能#python +1
    共 14 条
  • 1
  • 2
  • 请选择