logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文速递】2025年第19周(May-04-10)(Robotics/Embodied AI/LLM)

推理是智力的核心,塑造了做出决策,得出结论并跨越领域的能力。在人工智能中,随着系统越来越多地在开放,不确定和多模式环境中运行,推理对于实现鲁棒和适应性行为至关重要。大型多模式推理模型(LMRMS)已成为一种有希望的范式,将诸如文本,图像,音频和视频之类的模式集成在一起,以支持复杂的推理能力,并旨在获得全面的感知,精确的理解和深刻的推理。随着研究的发展,多模式推理从模块化,感知驱动的管道迅速发展为统

文章图片
#人工智能#机器人#AI
【论文速递】2025年第18周(Apr-27-May-03)(Robotics/Embodied AI/LLM)

我们介绍了Camerabench,这是一个大规模数据集和基准测试,旨在评估和改善相机运动的理解。Camerabench由约3,000个不同的互联网视频组成,通过严格的多级质量控制过程,由专家注释。我们的贡献之一是与摄影师合​​作设计的相机运动原始图的分类法。例如,我们发现某些动议(例如“关注”(或跟踪))需要了解诸如移动主题之类的场景内容。我们进行了一项大规模的人类研究,以量化人类注释绩效,揭示了

文章图片
#人工智能#机器人#AI
【论文速递】2025年第27周(Jun-29-Jul-05)(Robotics/Embodied AI/LLM)

我们提出GLM-4.1V思维,这是一种旨在推进通用多种模束推理的视觉模型(VLM)。在本报告中,我们在以推理为中心的培训框架的开发中分享了我们的关键发现。我们首先通过大规模的预训练开发具有巨大潜力的能力的视觉基础模型,这可以说是最终表现的上限。通过课程抽样(RLC)进行的强化学习,然后释放了模型的全部潜力,从而导致各种任务的全面能力增强,包括STEM问题解决,视频理解,内容识别,基础,基于GUI的

文章图片
#人工智能#机器人#AI
【论文速递】2025年第24周(Jun-08-14)(Robotics/Embodied AI/LLM)

在这项工作中,我们将强化预训练(RPT)作为大型语言模型和强化学习(RL)的新缩放范式(RPT)。具体来说,我们将下一步预测重新构建为使用RL训练的推理任务,在该任务中,它可以在其中获得可验证的奖励,以正确预测给定上下文的下一代币。RPT提供了一种可扩展的方法来利用大量文本数据作为通用RL,而不是依靠特定于域的注释答案。通过激励下一言推理的能力,RPT显着提高了预测下一代币的语言建模准确性。此外,

文章图片
#人工智能#深度学习#机器学习 +2
【论文速递】2025年第39周(Sep-21-27)(Robotics/Embodied AI/LLM)

我们推出了 Qwen3-Omni,这是一个单一的多模态模型,它首次在文本、图像、音频和视频方面保持了最先进的性能,相对于单模态模型没有任何退化。Qwen3-Omni 的性能与 Qwen 系列中相同尺寸的单模态模型的性能相当,尤其在音频任务方面表现出色。在 36 个音频和视听基准测试中,Qwen3-Omni 在 32 个基准测试中实现开源 SOTA,在 22 个基准测试中实现整体 SOTA,表现优于

文章图片
#人工智能#深度学习#机器人 +1
【ROS2】服务 Service Hello World 代码示例讲解(C++版)

其中,使用指定编译系统为hello_world_service_cpp:自定义功能包名称结果如下图:其中,有ROS2建议创建一个 License 文件以说明该功能包的发布许可。可以使用└── src。

文章图片
#机器人#人工智能#c++
【论文速递】2025年第33周(Aug-10-16)(Robotics/Embodied AI/LLM)

我们提出GLM-4.5,是具有355B总参数和32B激活参数的开源外源混合物(MOE)大型语言模型,具有一种支持思维和直接响应模式的混合推理方法。通过对23T代币的多阶段培训以及通过专家模型迭代和强化学习的全面培训,GLM-4.5实现了跨代理,推理和编码(ARC)任务的强劲性能,在Tau-Bench上得分为70.1%,AIME 24的91.0%,在SWE-Bench上获得了64.2%的验证。GLM

文章图片
#人工智能#机器人#AI +1
【论文速递】2025年02周 (Robotics/Embodied AI/LLM)

作者: Xinyu Guan, Li Lyna Zhang, Yifei Liu, Ning Shang, Youran Sun, Yi Zhu, Fan Yang, Mao Yang日期: 2025-01-08论文链接: https://arxiv.org/pdf/2501.04519We present rStar-Math to demonstrate that small language

文章图片
#机器人#人工智能#AI
【论文速递】2025年07周 (Robotics/Embodied AI/LLM)

标题作者日期论文链接项目链接我们以系统的方式研究了一个广泛提出的问题:LLMS是否真的了解他们说的话?这与更熟悉的术语随机鹦鹉有关。为此,我们提出了对理解的物理概念理解任务物理学的总结性评估。我们的任务通过使用网格形式的输入来减轻记忆问题,这些输入抽象地描述了物理现象。网格代表了不同水平的理解水平,从核心现象,应用程序示例到类比到网格世界中的其他抽象模式。对我们任务的全面研究表明:(1)最先进的L

文章图片
#人工智能#机器人#AI
【论文速递】2025年第40周(Sep-28-Oct-04)(Robotics/Embodied AI/LLM)

自约翰·冯·诺依曼和艾伦·图灵以来,计算系统与大脑之间的关系一直是先驱理论家的动力。均匀、无标度的生物网络(例如大脑)具有强大的特性,包括随着时间的推移进行泛化,这是机器学习通向通用推理模型的主要障碍。我们引入了“Dragon Hatchling”(BDH),这是一种新的大型语言模型架构,基于局部相互作用的神经元粒子的无标度生物启发网络。BDH 结合了强大的理论基础和固有的可解释性,而不牺牲类似

文章图片
#人工智能#深度学习#机器人 +1
    共 123 条
  • 1
  • 2
  • 3
  • 13
  • 请选择