
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
从炫技到实用。MirrorMe 在突破运动极限,BD 在正视安全问题,智元在搭建基础设施,新华网在呼吁产业落地。人形机器人行业正在从"能不能做"转向"怎么用好",这是一个好信号。📅 人形机器人行业日报 | 2026-02-07🤖 关注人形机器人面部表情、具身智能、行业动态💬 欢迎评论区交流讨论。
从炫技到实用。MirrorMe 在突破运动极限,BD 在正视安全问题,智元在搭建基础设施,新华网在呼吁产业落地。人形机器人行业正在从"能不能做"转向"怎么用好",这是一个好信号。📅 人形机器人行业日报 | 2026-02-07🤖 关注人形机器人面部表情、具身智能、行业动态💬 欢迎评论区交流讨论。
从炫技到实用。MirrorMe 在突破运动极限,BD 在正视安全问题,智元在搭建基础设施,新华网在呼吁产业落地。人形机器人行业正在从"能不能做"转向"怎么用好",这是一个好信号。📅 人形机器人行业日报 | 2026-02-07🤖 关注人形机器人面部表情、具身智能、行业动态💬 欢迎评论区交流讨论。
摘要:本研究提出了一种基于预测的机器人共情表达机制,旨在解决传统人机交互中表情延迟的问题。通过构建双模型系统:逆运动学模型(使机器人认知自身表情机制)和预测模型(识别人类微表情趋势),实现了机器人与人类表情的同步生成。实验表明,该机制能准确预判人类表情变化(准确率72.2%),在表情峰值时刻实现零延迟同步(指令耗时仅0.002秒)。这不仅突破了人机交互的技术瓶颈,更揭示了社交机器人应向人类本能学习

本文提出Rex-Omni模型,旨在结合传统视觉模型精准定位和多模态大语言模型(MLLM)复杂理解的优势。针对MLLM在物体检测中存在的坐标离散化和重复预测问题,研究团队采用三方面创新:1)统一任务为坐标预测;2)构建2200万高质量训练数据;3)通过监督微调(SFT)和强化学习(GRPO)两阶段训练,显著减少重复预测。实验表明,该模型在COCO检测、VisDrone密集场景等任务中表现优异,验证了
摘要: 本文提出DeepEyes系统,通过“交错多模态思维链”(iMCoT)和强化学习,使AI自主学会“放大观察”的视觉推理策略。传统多模态模型依赖压缩图像和文本推理,难以捕捉细节;而DeepEyes模拟人类“看-想-再看”的观察模式,动态调用放大工具聚焦关键区域。实验表明,仅7B参数的模型在细粒度视觉问答任务中超越GPT-4o等大模型,准确率提升18.9%,且逐步学会精准使用放大镜。该方法无需人
摘要: 当前多模态AI智能体在GUI操作任务中表现优异,但实际应用时频繁失败。研究发现,这些模型可能依赖记忆而非推理能力,导致泛化性差。为此,研究者提出Agent-ScanKit测试框架,通过视觉遮挡、文本删减和结构干扰三类扰动实验,系统评估18个主流模型的真实能力。结果显示:多数模型通过死记硬背坐标或指令模式完成任务,缺乏真正的视觉理解;强化学习和思维链技术仅部分缓解问题。该研究揭示了现有智能体
迪士尼研发新型互动机器人,让电子人偶更生动自然 迪士尼研究中心开发了一套创新的机器人系统,旨在提升乐园电子人偶的互动能力。该系统通过三层架构实现:感知层用摄像头捕捉游客行为,决策层基于状态机判断互动状态,表现层运用动画原理实现流畅动作。特别设计了眼球扫视技巧,创造真实注视的错觉。实验证明,这种结合机器人技术和动画艺术的方法能有效增强短时互动的"生命感"。未来有望通过参数调整赋予







