logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型何时需要检索?UCLA提出全新自监督选择性检索策略

©作者 |吴迪单位|UCLA研究方向 |自然语言处理前言最近一年开始做知识增强语言模型的方向。暑假去到了 AWS AI 的 CodeWhisperer 组实习,在 repository-level code completion 这个任务上进行了一些相关研究,有了一些发现,也投中了一篇 ICML Oral,便把感悟写成此文,希望大家多批评指正。背景2.1 检索增强语言模型(Retrieva...

#语言模型#人工智能#自然语言处理
通义灵码提出SWE-GPT,从静态代码建模迈向软件开发过程长链推理

©作者|马迎伟、黎槟华、李永彬单位|阿里通义实验室解决真实 GitHub issue 能力进化,通义灵码团队最新论文《An Open Development-Process-Centric Language Model for Automated Software Improvement》提出了面向程序改进的软件工程大模型通义灵码 SWE-GPT。开源模型首次在 SWE-bench Verifie

北京/杭州内推 | ​阿里通义灵码团队招聘大语言模型方向研究型实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!阿里巴巴阿里巴巴通义实验室-通义灵码团队,推进大模型在智能化软件工程,智能编码领域的应用,主要技术包括:1)代码大模型;2)AI Agents;3) 结合软件工程领域特征的高效训练,微调等。通义灵码产品介绍:https://tongyi.aliyun.com/lingma团..

#语言模型#人工智能#自然语言处理
数十亿行代码训练,GitHub原生AI代码生成工具上线,网友:要终结编程?

作者 |机器之心编辑部来源 |机器之心AI 编程辅助工具 Copilot:微软、OpenAI、GitHub 三家联合打造。GitHub Copilot 是一个 AI 代码合成器,并不是...

#编程语言#python#人工智能 +2
北大提出Repaint123:1张图2分钟转3D!纹理质量、多视角一致性新SOTA

©作者 |张俊武、唐振宇等单位 |北京大学来源 |量子位只需两分钟,玩转图片转 3D!还是高纹理质量、多视角高一致性的那种。不管是什么物种,输入时的单视图图像还是这样婶儿的:两分钟后,3D 版大功告成:▲上:Repaint123 (NeRF);下:Repaint123 (GS)新方法名为 Repaint123,核心思想是将 2D 扩散模型的强大图像生成能力与再绘策略的纹理对齐能力相结合,来...

#3d
北京内推 | 中关村人工智能研究院招聘人工智能研究岗/算法岗/系统工程岗

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!中关村人工智能研究院中关村人工智能研究院是一家坐落于北京的前沿人工智能研究院,专注于开展面向未来、具有产业价值、引领型的人工智能技术研发及成果转化落地,通过突破性的科技创新推动科学进步、产业升级和社会发展。作为研究院的一员,您将与领域内最具影响力的专家合作,在开放、包容的创新环

#人工智能#算法
港大联合微信推出DiffMM:扩散模型重塑多模态推荐系统的全新范式

香港大学黄超教授领导的数据智能实验室,与微信研发团队联合开发了一种基于扩散模型的全新多模态推荐系统范式 - DiffMM。这项创新性成果融合了扩散模型技术,能够有效利用多种模态数据,为用户提供个性化、精准的多媒体内容推荐服务。论文标题:DiffMM: Multi-Modal Diffusion Model for Recommendation论文链接:https://arxiv.org/abs/2

AAAI 2023 | 如何识别未知标签?多模态知识迁移框架实现新SOTA

©作者 |腾讯优图实验室来源|机器之心在多标签分类系统中,经常遇到大量在训练集中未曾出现的标签,如何准确地识别这些标签是非常重要也极富挑战性的问题。为此,腾讯优图实验室联合清华大学和深圳大学,提出了一种基于多模态知识迁移的框架 MKT,利用图文预训练模型强大的图文匹配能力,保留图像分类中关键的视觉一致性信息,实现多标签场景的 Open Vocabulary 分类。本工作已入选 AAAI 20...

CVPR 2023 | 中山大学HCP实验室新突破:用因果范式再升级多模态大模型

©作者 |机器之心编辑部来源 |机器之心中山大学人机物智能融合实验室(HCP)在 AIGC 及多模态大模型方面成果丰硕,在近期的 AAAI 2023、CVPR 2023 先后入选了十余篇,位列全球研究机构的第一梯队。其中一个工作实现了用因果模型来显著提升多模态大模型在调优中的可控及泛化性——《Masked Images Are Counterfactual Samples for Robust..

#深度学习#人工智能#计算机视觉 +2
当推荐系统遇见大语言模型:通往未来的三条路径

©作者 | 张月鹏单位 |得物研究方向 | 搜推算法前言自从大语言模型爆火之后,大家对大语言模型(LLM)如何成功应用在推荐系统进行了不少尝试。个人一直觉得 LLM 在工业界推荐系统大部分情况还是离线应用,生成一些特征或者文本。至于其直接用作召回和排序模块,个人对这块的观点一直是比较悲观的。出于两点考虑:1)推理耗时问题,大模型的推理耗时难以满足推荐系统快速响应的体验要求;2)基于 ID 和用户.

#语言模型#人工智能#自然语言处理
    共 189 条
  • 1
  • 2
  • 3
  • 19
  • 请选择