logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

智源悟界·Emu3.5:开启多模态世界大模型新纪元

DiDA 将传统的串行逐 token 生成过程,转变为一个多步并行的预测过程,在不牺牲性能的前提下,将每张图片的推理速度提升了近 20 倍,首次使自回归模型的生成效率媲美顶尖的闭源扩散模型。作为悟界·Emu 系列的最新成员,Emu3.5 延续了将图像、文本和视频等多模态数据统一建模的核心思想,并实现了从“下一Token 预测”(Next-Token Prediction)到“下一状态预测”(Nex

文章图片
#人工智能
智源悟界·Emu3.5:开启多模态世界大模型新纪元

DiDA 将传统的串行逐 token 生成过程,转变为一个多步并行的预测过程,在不牺牲性能的前提下,将每张图片的推理速度提升了近 20 倍,首次使自回归模型的生成效率媲美顶尖的闭源扩散模型。作为悟界·Emu 系列的最新成员,Emu3.5 延续了将图像、文本和视频等多模态数据统一建模的核心思想,并实现了从“下一Token 预测”(Next-Token Prediction)到“下一状态预测”(Nex

文章图片
#人工智能
单图高精度6D位姿估计方法开源,让机器人“一眼看懂”陌生物体

为此,团队设计了一套粗到精的联合迭代优化策略,将尺度恢复融入端到端位姿估计流程,先快速初始化位姿(粗对齐),再通过迭代优化最终达到毫米级精度(精对齐)。当先验信息缺失(如无CAD模型、无多视角数据)时,系统不再被动等待理想输入,而是主动“生成-对齐”,利用生成式 AI 补全物体的完整3D结构,并通过几何与尺度的联合优化,将其精准锚定在真实空间中。实验过程:左列为锚点图像,中列为生成的 3D 模型,

文章图片
#机器人
众智FlagOS的统一通信库实现国家与国际标准“双立项”

国内国际标准双驱动,助力构建开放共融的AI系统生态

文章图片
#人工智能
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

北京智源人工智能研究院 VectorSpace Lab 团队近日发布了全新的高保真奖励模型系列——EditScore,旨在为指令引导的图像编辑任务提供精确、可靠的奖励信号,从而为强化学习在 AIGC 领域的深入应用铺平道路,真正解锁其强大潜力。

文章图片
#人工智能
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

北京智源人工智能研究院 VectorSpace Lab 团队近日发布了全新的高保真奖励模型系列——EditScore,旨在为指令引导的图像编辑任务提供精确、可靠的奖励信号,从而为强化学习在 AIGC 领域的深入应用铺平道路,真正解锁其强大潜力。

文章图片
#人工智能
智源开源EditScore:为图像编辑解锁在线强化学习的无限可能

北京智源人工智能研究院 VectorSpace Lab 团队近日发布了全新的高保真奖励模型系列——EditScore,旨在为指令引导的图像编辑任务提供精确、可靠的奖励信号,从而为强化学习在 AIGC 领域的深入应用铺平道路,真正解锁其强大潜力。

文章图片
#人工智能
【无标题】

在智源研究院,我们不仅努力构建解决当下问题的 AI 工具,更致力于探索生物智能与人工智能演化的深层原理。我们相信,复杂系统的涌现离不开功能表现与物理结构的相互作用,我们的科研布局也始终围绕“功能”(Functionality)与“结构”(Structure)两大核心维度展开。在这一理念的指引下,智源研究院生命模拟中心将“数字孪生心脏”作为一个长期投入的核心方向,围绕“如何用数字化的方式精准还原和模

文章图片
#人工智能
从云端到终端,从大模型到机器人:智源众智FlagOS 1.5引领开放计算生态迈向成熟

9月26-27日,在北京举办的首届FlagOS开放计算开发者大会上,北京智源人工智能研究院(简称“智源研究院”)携手18个共创团队、超过60个全球生态合作伙伴,正式发布开源大模型智算基座“众智FlagOS 1.5”,已经支持了16家厂商超过20多款芯片,作为一个面向多种AI芯片的统一开源系统软件栈,众智FlagOS 1.5的发布标志着全球人工智能底层技术生态正迈向一个以“开放计算”为核心理念的协同

#机器人
图像生成新范式:智源推出全能视觉生成模型 OmniGen

近年来,许多文生图模型在生成式 AI 的浪潮中脱颖而出。然而,这些出色的专有模型仅能基于文本生成图像。当用户产生更灵活、复杂、精细等的图像生成需求时,往往需要额外的插件和操作。例如,若想参考任一姿态生成图像,常规方法是:用姿态检测器从参考图像中估计姿态作为条件输入,并加载对应的 Controlnet 插件,最后提取条件输入的特征馈入扩散模型生成图像。此外,若想基于合照中的特定人物生成新图像,流程更

文章图片
#人工智能
    共 37 条
  • 1
  • 2
  • 3
  • 4
  • 请选择