logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Lerobot框架使用(含本地数据训练)

本文详细的介绍了使用lerobot框架在so-arm100机械臂上复现相关robot learning算法详细流程(含本地数据训练和错误排查)。

文章图片
#python#linux#人工智能 +3
星尘自研Lumo-1模型(mind to hand)详细解读

《Mind to Hand: 具身推理驱动的机器人控制框架》提出了一种创新性的机器人控制架构,通过离散动作分词器和强化学习实现了语义推理与精准操作的统一。

文章图片
#深度学习#美食#transformer +2
Kyle Vedder:Robot Learning现状

2025年机器人学习仍主要依赖行为克隆(BC)技术,通过模仿人类演示数据来训练策略。数据收集方式包括主从遥操、智能演示手套和直接人体演示,各有优缺点。当前面临的主要挑战是策略在分布外状态的表现不佳,需通过DAgger方法迭代优化。尽管强化学习(RL)在理论上更具潜力,但由于模拟与现实差距、反事实推理困难等问题,实际应用受限。未来预测显示,视频模型骨干网将取代VLA,世界模型可能成为关键突破。建议关

文章图片
#人工智能#机器学习#算法
强化学习入门笔记

智能体通过​​试错​​和​​奖励反馈​​不断优化决策策略,以追求​​最大化累积回报​​的方法-RL

文章图片
#人工智能#深度学习
大模型的分词器——算法及示例

分词是自然语言处理的基础技术,将文本分割为离散单元(如单词、子词或字符)。主流方法包括词级、字符级和子词分词,其中子词分词(如BPE、WordPiece)通过拆分单词平衡了词汇表大小与序列长度。BPE通过频次合并字符对构建词汇表,WordPiece则基于互信息分数优化合并策略。这些方法解决了未知词汇问题,提升了模型效率,广泛应用于GPT、BERT等大型语言模型。分词器的选择需考虑任务需求(单语言/

文章图片
#算法#人工智能#python +1
机器人学导论速览

帮助读者快速浏览机器人学导论内容。

文章图片
#美食#线性代数#科技
到底了