kaiyuan_sjtu 个人主页

@Kaiyuan_sjtu

kaiyuan_sjtu

2023-01-10 11:18:30 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

最新版 | 李沐《动手学深度学习》中文版pdf重磅开源！

强烈推荐李沐等人开源的《动手学深度学习》最新版！完整中文版 PDF 终于更新可下载：《动手学深度学习》旨在向读者交付有关深度学习的交互式学习体验。书中不仅阐述深度学习的算法原理，还演示它...

#firefox

LLM4Rec：当推荐系统遇到大语言模型

作者|kaiyuanhttps://bytedance.larkoffice.com/docx/OdGOdfsIPooznDx5ZvfcFqJjnne大家好，这里是NewBeeNLP。大模型LLM在越来越多的领域开始崭露头角，前段时间我们整理了大模型在推荐系统中的应用 survey，当时留了一些坑没填上，今天补上。完整阅读体验可看：https://bytedance.larkoffice.c...

#语言模型 #人工智能 #深度学习 +2

ACL2024 | AI的时空穿越记：大型语言模型共时推理的奇幻之旅！

作者：苏肇辰标题：Living in the Moment: Can Large Language Models Grasp Co-Temporal Reasoning?录取：ACL2024 Main论文链接：https://arxiv.org/abs/2406.09072代码链接：https://github.com/zhaochen0110/Cotempqa单位：苏州大学、上海人工智能实验室?

#人工智能 #语言模型 #自然语言处理

跨域推荐：迁移学习和推荐系统的火花碰撞

作者|Chilia整理|NewBeeNLP什么是跨域推荐呢？一句话概括就是：跨域推荐（Cross-Domain Recommendation）是迁移学习在推荐系统中的一种应用。跨域推荐的目的一般是下面几个：解决冷启动/数据稀疏问题：例如，一个公司的两个APP业务，用户群体(user)交叉很大，但是item不同，当A业务的用户首次来访B业务时（冷启...

#python #机器学习 #人工智能 +1

DeepSeek大模型原创核心技术解读

原文：https://zhuanlan.zhihu.com/p/20751924531一、DeepSeek[1]核心理论创新1.MLA[2]大模型架构创新自GPT采用Transformer架构取得成功以来，经典Transformer架构一直是很多大模型的标配。但这不意味着Transformer是完美无缺的。DeepSeek在Transformer架构的基础上也做了很多创新，主要为：多头潜在注意力即

SIGIR'21「微软」：强化学习过滤负样本噪声提升点击率

title：RLNF: Reinforcement Learning based Noise Filtering for Click-Through Rate Predictionlink...

#人工智能 #机器学习 #深度学习 +2

综述！推荐系统中的自监督学习

作者|上杉翔二悠闲会·信息检索整理|NewBeeNLP在我们之前分享的『对比学习+推荐』的文章中曾经提到，自监督学习被引入推荐系统领域主要有以下优势：舒缓数据稀疏。一般来说推荐系统的数据集，有点击的监督数据不便于收集，非常少，而且高度稀疏化，因此通过自监督学习是可以对数据进行增强和扩增的；舒缓噪音干扰。不但数据集稀疏，而且比如...

#python #机器学习 #人工智能 +2

知识图谱｜各生命周期主流算法 & 实践

知识图谱是大数据时代知识表示的主要形态之一，是人工智能应用不可或缺的基础资源，自2012年提出至今，受到学术界和产业界越来越多的关注。伴随着人工智能浪潮，知识图谱迅速发展，已经在语义搜索、...

#编程语言 #人工智能 #知识图谱

盘点！Instruction Tuning 时代的大模型

作者|Kevin吴嘉文整理|NewBeeNLP公众号https://zhuanlan.zhihu.com/p/616830127Alpaca，ChatGLM 等模型的效果可以接受，下文总结部分笔记，为训练自定义小型化（7B）模型提供点知识储备。包括模型论文 LaMDA, Muppet, FLAN, T0, FLAN-PLAM, FLAN-T5LaMDA论文：Language Model...

#人工智能 #深度学习 #机器学习

腾讯基于预训练模型的文本内容理解实践

分享嘉宾：赵哲博士腾讯高级研究员编辑整理：张书源爱丁堡大学出品平台：DataFunTalk导读：预训练已经成为自然语言处理任务的重要组成部分，为大量自然语言处理任务带来了显著提升。本...

#大数据 #算法 #编程语言 +2

共 286 条

请选择