logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

# 从 Gymnasium 到 Minari:新一代机器人强化学习工具链全指南

Gymnasium 及其机器人环境扩展的安装配置如何运行 PointMaze 和 Fetch 等经典机器人任务Minari 离线数据集的下载与使用方法这套工具链解决了旧版 Gym 和 D4RL 的诸多问题,提供了更稳定、更易用的开发体验。无论是学术研究还是实际应用,都能显著提高强化学习实验的效率。下一步,你可以尝试将这些环境与具体的强化学习算法结合,或使用 Minari 数据集进行离线强化学习研究

#机器人#python#人工智能
史上最详细Carla增加Town6,Town7,Town10地图教程以及简单代码测试

简单记录一下再Carla中增加Town6,Town7,Town10环境以及代码测试笔记本配置1、内存:+16 GB RAM memory2、显存:+8 GB Video memory3、处理器: Intel® Core™ i9-14900HX 2.20 GHz4、操作系统:10Windows,64 位操作系统, 基于 x64 的处理器5、Carla版本:0.9.146、python版本:3.7.1

文章图片
#人工智能#机器学习#游戏引擎
hugging face下载数据集报错Loading a dataset cached in a LocalFileSystem is not supported解决方案

最近在微调qwen-2.5-3B模型时遇到一些问题,后续会陆续总结到这篇文章中。

#python#人工智能#linux
hugging face下载数据集报错Loading a dataset cached in a LocalFileSystem is not supported解决方案

最近在微调qwen-2.5-3B模型时遇到一些问题,后续会陆续总结到这篇文章中。

#python#人工智能#linux
hugging face下载数据集报错Loading a dataset cached in a LocalFileSystem is not supported解决方案

最近在微调qwen-2.5-3B模型时遇到一些问题,后续会陆续总结到这篇文章中。

#python#人工智能#linux
强化学习概念辨析(On-line,Off-line)

在线学习是一种机器学习范式,其核心特点是智能体(或模型)通过与环境的实时交互逐步获取数据,并在每一步数据获取后立即更新模型参数。整个过程呈现 “数据采集→模型训练→决策优化” 的动态循环,类似于人类通过持续实践不断积累经验的过程。离线学习是一种传统的机器学习范式,其核心特点是智能体(或模型)在训练阶段完全基于 预先收集的静态数据集 进行学习,训练完成后直接用于部署和决策。整个过程分为数据收集→批量

#人工智能#机器学习
AutoDL 数据盘清理指南:彻底删除 .Trash-0 内文件释放空间

通过本文的介绍,你应该已经掌握了如何清理 AutoDL 实例中.Trash-0内的文件。记住,定期清理和良好的文件管理习惯是避免磁盘空间问题的关键。如果你在操作过程中遇到任何问题,欢迎在评论区留言讨论。

#python
到底了