
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Lerobot框架使用(含本地数据训练)
本文详细的介绍了使用lerobot框架在so-arm100机械臂上复现相关robot learning算法详细流程(含本地数据训练和错误排查)。

星尘自研Lumo-1模型(mind to hand)详细解读
《Mind to Hand: 具身推理驱动的机器人控制框架》提出了一种创新性的机器人控制架构,通过离散动作分词器和强化学习实现了语义推理与精准操作的统一。

Kyle Vedder:Robot Learning现状
2025年机器人学习仍主要依赖行为克隆(BC)技术,通过模仿人类演示数据来训练策略。数据收集方式包括主从遥操、智能演示手套和直接人体演示,各有优缺点。当前面临的主要挑战是策略在分布外状态的表现不佳,需通过DAgger方法迭代优化。尽管强化学习(RL)在理论上更具潜力,但由于模拟与现实差距、反事实推理困难等问题,实际应用受限。未来预测显示,视频模型骨干网将取代VLA,世界模型可能成为关键突破。建议关

大模型的分词器——算法及示例
分词是自然语言处理的基础技术,将文本分割为离散单元(如单词、子词或字符)。主流方法包括词级、字符级和子词分词,其中子词分词(如BPE、WordPiece)通过拆分单词平衡了词汇表大小与序列长度。BPE通过频次合并字符对构建词汇表,WordPiece则基于互信息分数优化合并策略。这些方法解决了未知词汇问题,提升了模型效率,广泛应用于GPT、BERT等大型语言模型。分词器的选择需考虑任务需求(单语言/

到底了









