logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[论文阅读] π0: A Vision-Language-Action Flow Model for General Robot Control

作为一个通用的机器人策略,模型的核心结构是采用一个预训练的 VLM 模型,加上一个动作专家(Action Expert),动作专家通过 Flow Matching 生成连续的动作。Flow Matching 应该是 Diffusion 的一种变体。VLM、LLM 等模型虽然已经取得了广泛的成果,但它们始终未能直接产生对物理世界的交互:它们的模型输入是图片或语言,输出也是。

文章图片
#论文阅读
北森 图形测评 类题目总结

最近秋招,除了笔试外,还做了很多人才测评的题目,里面的图形推理题有时候看了真是毫无头绪,根本看不出什么规律,于是去某鱼上专门淘了个题库,整理出如下文档,分享同样有需要的大家。

文章图片
#面试
到底了