logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【科研快讯】从单兵作战到联盟协同:Science Robotics提出机器人基础模型的范式重构

《Science Robotics》2026年4月发表观点文章,批判当前机器人基础模型过度追求单体智能的局限,提出"联盟感知"新范式。研究团队来自慕尼黑工业大学等机构,主张机器人应具备多智能体协作能力,从"独立学习"转向"协同学习"。文章构建了包含交互先验、伙伴建模等六大支柱的技术框架,并展望了在智慧工厂、医疗等四大场景的应用前景。该研究

文章图片
【科研快报】国产大模型重磅突破:编程能力力压GPT-5.5,全球首个三项全能开源模型登场

国产AI大模型MiniMax M3重磅发布,首次实现编程能力顶尖、百万Token上下文和原生多模态"三项全能"的开源突破。该模型在SWE-BenchPro编程测试中得分59.0%,超越GPT-5.5,并采用创新的MSA稀疏注意力架构将长文本处理效率提升20倍。实测显示M3能独立复现学术论文实验,产出完整代码和图表。作为全球首个同时具备三大能力的开源模型,M3现已开放API并将于

文章图片
#多模态
【学术干货】大规模激活:解锁 Diffusion Transformers 局部细节合成的新钥匙

《扩散Transformer中的大规模激活与细节引导策略研究》摘要 本文聚焦扩散概率模型(DiT)中的大规模激活现象(MAs),通过系统性实证研究揭示其时空分布规律与功能角色,并提出创新的Detail Guidance(DG)无训练引导策略。研究发现:1) MAs动态分布于DiT各层,在去噪中期最活跃,主要参与局部细节合成;2) 通过抑制/增强MAs可实现细节质量的定向调控;3) 基于此提出的DG

文章图片
【科研快讯】具身智能泛化难题新突破:RoboScience团队Bi-Adapt框架实现双臂操作跨类别迁移

摘要: 邵林团队论文《Bi-Adapt》入围机器人操作与运动方向最佳论文奖提名,连续两年获此殊荣。该研究通过语义对应实现跨类别双臂操作泛化,仅需少量样本即可适应新物体,仿真成功率59%-70%,显著优于基线方法。其“视觉语义迁移+物理交互适配”范式为具身智能提供了高效泛化新路径,有望加速机器人实际应用部署。

文章图片
#机器人
学术干货|DDT:解耦扩散Transformer实现高效高质量图像生成

然而,扩散模型也面临着严峻的计算效率挑战。2023年提出的DiT(Diffusion Transformer)证明,基于Transformer的扩散模型在规模化训练中展现出优于U-Net架构的生成能力,奠定了现代扩散Transformer的技术基础。研究表明,DDT中的条件编码器存在明显的规模效应——更大的编码器能够带来更显著的性能提升。DDT的提出正是对这一挑战的系统性回应,其核心理念是通过架构

文章图片
【科研快讯】KAIST突破性研究:让机器人“读懂“人类意图——VOTP算法开启Physical AI新纪元

人工智能正经历从"生成式AI"向"Physical AI"的范式跃迁。所谓Physical AI,是指能够操控实体机械、在物理世界中自主决策与执行任务的智能系统——工业机器人替代人类完成高危作业、自动驾驶汽车自主判断路况、医疗机器人实施精准外科手术,皆属此列。

文章图片
【科研快讯】KAIST突破性研究:让机器人“读懂“人类意图——VOTP算法开启Physical AI新纪元

人工智能正经历从"生成式AI"向"Physical AI"的范式跃迁。所谓Physical AI,是指能够操控实体机械、在物理世界中自主决策与执行任务的智能系统——工业机器人替代人类完成高危作业、自动驾驶汽车自主判断路况、医疗机器人实施精准外科手术,皆属此列。

文章图片
【学术干货】清华团队发布RWAI框架:让AI从“能做“到“能落地“,产业应用效率提升50%

【摘要】清华大学长三角研究院AI创新中心提出RWAI框架,破解大模型落地难题。该框架针对模型能力"过剩"与应用效率不足的矛盾,通过三大创新:1)任务集机制增强场景适配性;2)人类反馈分类体系实现量化评估;3)标准化交互协议提升协作效率。实测显示,该方案使效果验证周期缩短80%至2周,开发效率提升50%以上。配套推出的RWAIArena竞技场突破传统跑分模式,聚焦实际业务效能评估

文章图片
#人机交互
【科研快报】国产大模型重磅突破:编程能力力压GPT-5.5,全球首个三项全能开源模型登场

国产AI大模型MiniMax M3重磅发布,首次实现编程能力顶尖、百万Token上下文和原生多模态"三项全能"的开源突破。该模型在SWE-BenchPro编程测试中得分59.0%,超越GPT-5.5,并采用创新的MSA稀疏注意力架构将长文本处理效率提升20倍。实测显示M3能独立复现学术论文实验,产出完整代码和图表。作为全球首个同时具备三大能力的开源模型,M3现已开放API并将于

文章图片
#多模态
【科研快报】Nature子刊重磅|HESpotEx:深度学习首次实现从病理图像直接预测基因表达

HESpotEx是一种创新的双流深度学习框架,首次实现从常规H&E染色病理切片直接预测空间基因表达。该模型通过图像编码器和图注意力自动编码器分别提取视觉特征与空间关系,再经图卷积网络解码生成5,457个基因的表达图谱。实验显示其预测准确性优于现有方法(平均MSE 0.0589,中位PCC 0.1356),并具备强可解释性,可关联基因表达与组织形态特征。该技术突破分子检测成本高、技术复杂的瓶

文章图片
#深度学习#神经网络
    共 16 条
  • 1
  • 2
  • 请选择