logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM增强强化学习:开启智能决策的新篇章

LLM增强的强化学习为解决传统RL的诸多挑战提供了新的思路和方法。LLM作为信息处理器、奖励设计者和决策者,分别从数据处理、奖励设计和决策支持等方面为RL注入了强大的能力。这种结合不仅让智能体能够更好地理解和处理多模态信息,还提高了学习效率和泛化能力,为RL在复杂任务中的应用开辟了新的可能。🌟。

文章图片
#人工智能
文献阅读分享:跨域顺序推荐中的用户检索与大语言模型集成

双图序列建模模型:结合LLM增强的物品-属性图和物品-物品序列图,捕捉协同和结构-语义信息.用户检索-生成模型:通过KNN检索器检索目标领域中与用户最相似的用户,并将结构化文本与协同信息无缝融合到LLM中.领域差异化策略和答案精炼模块:确保输入和生成的输出在特定领域内,提升模型的领域特定生成能力.

文章图片
#语言模型#人工智能#自然语言处理
【NeurIPS 2024】LLM-ESR:用大语言模型破解序列推荐的长尾难题

在电商和社交媒体的世界里,序列推荐系统(Sequential Recommendation Systems, SRS)就像一个贴心的购物助手,它通过分析用户的历史行为来预测他们接下来可能感兴趣的商品。:对于长尾用户,LLM-ESR通过检索与目标用户语义相似的用户,并利用他们的交互信息来增强目标用户的偏好表示,就像是给长尾用户“借”了一些有用的信息。LLM-ESR它提出了一个全新的框架,用LLM的语

文章图片
#语言模型#人工智能#自然语言处理
WWW‘24:Collaborative Large Language Model for Recommender Systems文献阅读

本文介绍了一种新型的基于协同大型语言模型(CLLM4Rec)的推荐系统,该系统将传统的基于ID的推荐系统范式与基于大型语言模型(LLM)的范式相结合,旨在解决自然语言与推荐任务之间语义差异的问题。通过引入用户/项目ID标记和创新的软+硬提示策略,CLLM4Rec能够有效地学习用户和项目的协同和内容语义,从而提高推荐的准确性和效率。CLLM4Rec采用互惠正则化策略进行预训练,以学习用户和项目的协同

文章图片
#前端#语言模型#人工智能
机器学习顶会NeurIPS: AGILE: A Novel Reinforcement Learning Framework of LLM Agents

此外,AGILE框架还创新性地引入了主动寻求人类专家建议的能力,使代理在面对复杂问题时能够及时获取准确答案,并从中学习和积累知识,以适应新任务。例如,在ProductQA任务中,agile-vic13b-ppo模型的总性能得分比GPT-4高出9.2%,在MedMCQA任务中,agile-mek7b-ppo模型的准确率从基础模型的53.4%提升至85.2%,超越了GPT4-MedPrompt的79.

文章图片
#机器学习#敏捷流程#人工智能
文献阅读分享:LLM4Rerank——基于LLM的推荐系统自动重排序框架

例如,从“Accuracy”节点开始,可能经过“Diversity”和“Fairness”节点,最终到达“Stop”节点,完成重排序。本文提出了LLM4Rerank,一个基于LLM的自动重排序框架,旨在通过自动整合多种重排序需求(如准确性、多样性和公平性),实现可扩展性和个性化。近年来,随着大型语言模型(LLM)的发展,其在信息检索和推荐任务中的潜力逐渐被挖掘,但直接应用于重排序任务时仍面临挑战,

文章图片
#人工智能#深度学习
到底了