logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文速递】2025年第26周(Jun-22-28)(Robotics/Embodied AI/LLM)

现代参数高效微调(PEFT)方法,如低秩自适应(LoRA),降低了定制大型语言模型(LLM)的成本,但仍然需要对每个下游数据集进行单独的优化运行。我们引入了拖放LLM(\textit{DnD)},这是一个提示条件参数生成器,通过将少数未标记的任务提示直接映射到LoRA权重更新来消除每任务训练。轻量级文本编码器将每个提示批提取为条件嵌入,然后由级联的超卷积解码器将其转换为完整的LoRA矩阵集。

文章图片
#人工智能#机器人#AI
【论文速递】2025年第25周(Jun-15-21)(Robotics/Embodied AI/LLM)

我们介绍了Minimax-M1,这是世界上第一个开放重量的大规模混合注意推理模型。Minimax-M1由杂种混合物(MOE)结构供电,并结合了闪电注意机制。该模型是基于我们以前的最小Text-01模型开发的,该模型包含4560亿个参数,每个令牌激活了459亿个参数。M1模型本质上支持上下文长度为100万个令牌,8倍DeepSeek R1的上下文大小。此外,Minimax-M1中的闪电注意机制可以有

#人工智能#机器人#AI
【论文速递】2025年第24周(Jun-08-14)(Robotics/Embodied AI/LLM)

在这项工作中,我们将强化预训练(RPT)作为大型语言模型和强化学习(RL)的新缩放范式(RPT)。具体来说,我们将下一步预测重新构建为使用RL训练的推理任务,在该任务中,它可以在其中获得可验证的奖励,以正确预测给定上下文的下一代币。RPT提供了一种可扩展的方法来利用大量文本数据作为通用RL,而不是依靠特定于域的注释答案。通过激励下一言推理的能力,RPT显着提高了预测下一代币的语言建模准确性。此外,

文章图片
#人工智能#深度学习#机器学习 +2
【论文速递】2025年第23周(Jun-01-07)(Robotics/Embodied AI/LLM)

我们探讨了一种通过自我反思和强化学习来改善大语言模型的性能的方法。通过激励模型在错误地回答时产生更好的自我反射,我们证明了模型解决复杂的能力,即使生成合成数据是不可行的,并且只有二进制反馈,也可以增强可验证的任务。我们的框架分为两个阶段:首先,在未完成一项任务后,该模型会产生自我反射的评论,以分析其先前的尝试;其次,该模型在上下文中以自我反射为任务进行了另一次尝试。如果随后的尝试成功,则会奖励在自

#人工智能#机器人#AI
【论文速递】2025年第22周(May-25-31)(Robotics/Embodied AI/LLM)

我们介绍了Mutarjim,这是一种紧凑而强大的语言模型,用于双向阿拉伯语英语翻译。尽管大规模的LLM在自然语言处理任务(包括机器翻译,较小的型号)中显示出令人印象深刻的进展。利用这种见解,我们根据Kuwain-1.5b开发了Mutarjim,这是一种针对阿拉伯语和英语量身定制的语言模型。尽管大小适中,但Mutarjim在几个既定的基准测试基准上都胜过更大的模型,这是通过优化的两阶段训练方法和精心

#人工智能#机器人#AI
【论文速递】2025年第21周(May-18-24)(Robotics/Embodied AI/LLM)

在这项工作中,我们介绍了Qwen3,这是QWEN模型系列的最新版本。QWEN3包括一系列旨在提高性能,效率和多语言功能的大型语言模型(LLM)。QWEN3系列包括稠密和混合物(MOE)架构的模型,参数尺度范围为0.6至2350亿。QWEN3中的一个关键创新是整合思维模式(用于复杂,多步推理)和非思考模式(用于快速,上下文驱动的响应)中的统一框架。这消除了在不同模型之间切换的需求,例如聊天优化的模型

#人工智能#机器人#AI
【论文速递】2025年第20周(May-11-17)(Robotics/Embodied AI/LLM)

我们提出了SEED1.5-VL,这是一种视觉基础模型,旨在提高通用多模式的理解和推理。SEED1.5-VL由532M参数视觉编码器和20B活动参数的Experts(MOE)LLM组成。尽管具有相对紧凑的建筑,但它在广泛的公共VLM基准和内部评估套件中提供了良好的性能,在60个公共基准中的38台实现了最先进的性能。此外,在以代理为中心的任务(例如GUI控制和游戏玩法)中,SEED1.5-VL胜过领先

文章图片
#人工智能#机器人#AI
【论文速递】2025年第19周(May-04-10)(Robotics/Embodied AI/LLM)

推理是智力的核心,塑造了做出决策,得出结论并跨越领域的能力。在人工智能中,随着系统越来越多地在开放,不确定和多模式环境中运行,推理对于实现鲁棒和适应性行为至关重要。大型多模式推理模型(LMRMS)已成为一种有希望的范式,将诸如文本,图像,音频和视频之类的模式集成在一起,以支持复杂的推理能力,并旨在获得全面的感知,精确的理解和深刻的推理。随着研究的发展,多模式推理从模块化,感知驱动的管道迅速发展为统

文章图片
#人工智能#机器人#AI
【论文速递】2025年第19周(May-04-10)(Robotics/Embodied AI/LLM)

推理是智力的核心,塑造了做出决策,得出结论并跨越领域的能力。在人工智能中,随着系统越来越多地在开放,不确定和多模式环境中运行,推理对于实现鲁棒和适应性行为至关重要。大型多模式推理模型(LMRMS)已成为一种有希望的范式,将诸如文本,图像,音频和视频之类的模式集成在一起,以支持复杂的推理能力,并旨在获得全面的感知,精确的理解和深刻的推理。随着研究的发展,多模式推理从模块化,感知驱动的管道迅速发展为统

文章图片
#人工智能#机器人#AI
【论文速递】2025年第19周(May-04-10)(Robotics/Embodied AI/LLM)

推理是智力的核心,塑造了做出决策,得出结论并跨越领域的能力。在人工智能中,随着系统越来越多地在开放,不确定和多模式环境中运行,推理对于实现鲁棒和适应性行为至关重要。大型多模式推理模型(LMRMS)已成为一种有希望的范式,将诸如文本,图像,音频和视频之类的模式集成在一起,以支持复杂的推理能力,并旨在获得全面的感知,精确的理解和深刻的推理。随着研究的发展,多模式推理从模块化,感知驱动的管道迅速发展为统

文章图片
#人工智能#机器人#AI
    共 82 条
  • 1
  • 2
  • 3
  • 9
  • 请选择