猫先生Mr.Mao 个人主页

@m_aigc2022

猫先生Mr.Mao

2024-08-05 11:07:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

具身智能之RynnBrain 1.1详解：如何把具身理解接到多本体动作

RynnBrain 1.1提出了一种面向通用具身智能的基础模型框架，旨在通过统一视觉语言骨干与空间表示，解决传统视觉语言模型（VLM）在机器人任务中“可执行信息缺失”的问题。模型提供2B、9B和122B-A10B三种规模，支持2D/3D目标定位、接触点预测及跨本体动作生成，并通过Flow Matching技术实现多机器人适配。论文强调空间语义与动作接口的统一性，分层验证了模型在认知、定位、操作等任

#机器人

具身智能之Room-to-Room详解：让智能体听懂“上楼后右转”——如何定义视觉语言导航

解读 Room-to-Room 如何以真实建筑全景、自然语言路线和显式 Stop 动作定义视觉语言导航，并梳理其 Seq2Seq 基线、评测指标与 Seen/Unseen 泛化难题。

#机器人

具身智能之Xiaomi-Robotics-1：如何把 VLA 的规模化落到真实机器人

解读 Xiaomi-Robotics-1 如何利用 100K+ 小时 UMI 真实操作轨迹，通过预训练与后训练两阶段配方扩展 VLA，并分析其 scaling 证据、下游适配能力与公开边界。

#机器人

具身智能之OneTwoVLA详解：如何统一推理与行动

写在前面【从零走向AGI 】旨在深入了解通用人工智能（AGI）的发展路径，从最基础的概念起，逐步构建完整的知识体系。项目地址 🔗： AIGC算法岗/开发岗面试面经交流社群（涵盖AI Agent、AIGC图像创作、AI视频、LLM大模型、AI多模态、数字人、传统深度学习、具身智能等AIGC面试干货资源）欢迎大家加入：导读具身任务同时需要两种节奏：低

#AI

具身智能之OneTwoVLA详解：如何统一推理与行动

#AI

具身智能之OneTwoVLA详解：如何统一推理与行动

#AI

具身智能之OneTwoVLA详解：如何统一推理与行动

#AI

具身智能之Vlaser详解：推理分数高，不等于机器人更会动——VLM→VLA 迁移实验

#AI

具身智能之Vlaser详解：推理分数高，不等于机器人更会动——VLM→VLA 迁移实验

#AI

具身智能之Vlaser详解：推理分数高，不等于机器人更会动——VLM→VLA 迁移实验

#AI

共 25 条

请选择