logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

unitree_rl_gym-main 代码解读2_legged_gym

是整个强化学习训练流程的入口脚本,代码简洁,主要负责初始化环境、训练器并启动训练过程。参数解析、环境初始化、训练器初始化、PPO 算法训练训练过程可分为参数解析、环境初始化、训练器初始化、PPO 算法训练四个核心步骤,具体流程如下:训练前首先通过函数(定义于 )解析命令行参数,核心参数包括:这些参数会用于后续环境和训练器的配置覆盖。 函数(定义于 )负责创建仿真环境,具体流程: 函数(定义于 )负

#深度学习#机器学习#人工智能
unitree_rl_gym-main 代码解读1_URDF

material>用于统一管理连杆的颜色(RGBA 格式,A 为透明度),例如腿部和躯干可能用不同颜色:xml-- 躯干:深灰色(不透明) -->-- 腿部:浅灰色 -->Go2 的 URDF 通过<link>定义了 “躯干 + 4 条腿(每条 3 个连杆)” 的物理结构和外观,通过<joint>定义了 12 个旋转关节(3 个 / 腿)的连接关系和运动范围,最终形成一个可被仿真环境(如 Gaze

#机器人
unitree_rl_gym-main 代码解读1_URDF

material>用于统一管理连杆的颜色(RGBA 格式,A 为透明度),例如腿部和躯干可能用不同颜色:xml-- 躯干:深灰色(不透明) -->-- 腿部:浅灰色 -->Go2 的 URDF 通过<link>定义了 “躯干 + 4 条腿(每条 3 个连杆)” 的物理结构和外观,通过<joint>定义了 12 个旋转关节(3 个 / 腿)的连接关系和运动范围,最终形成一个可被仿真环境(如 Gaze

#机器人
四足机器狗代码学习__Lite3_rl_deploy-main

继承自StateBase维护机器人观测状态(如 IMU、关节数据)异步执行强化学习策略并生成控制指令处理状态进入 / 退出逻辑安全检查(防止机器人姿态失控)通过异步线程周期性执行强化学习策略:主循环(Run())负责更新机器人观测数据,策略线程()根据观测数据和降频参数生成控制指令,同时通过安全检查确保机器人不会因姿态异常失控。整个流程实现了强化学习策略从观测到控制指令的闭环执行。

#学习
四足机器狗代码学习__Lite3_rl_deploy-main

继承自StateBase维护机器人观测状态(如 IMU、关节数据)异步执行强化学习策略并生成控制指令处理状态进入 / 退出逻辑安全检查(防止机器人姿态失控)通过异步线程周期性执行强化学习策略:主循环(Run())负责更新机器人观测数据,策略线程()根据观测数据和降频参数生成控制指令,同时通过安全检查确保机器人不会因姿态异常失控。整个流程实现了强化学习策略从观测到控制指令的闭环执行。

#学习
Text2SQL:自助式数据报表开发---0517

写法3通过其清晰的结构、完整的信和高可读性,能够更有效地引导模型生成准确的 SQL 查询。这种模板化的方法不仅提高了生成结果的质量,还便于维护和扩展,因此在实际应用中可能表现最佳。补全代码能力。

文章图片
#开发语言#深度学习#人工智能 +1
大语言模型---第一章 绪论

探索不针对单一任务进行微调的情况下如何能够发挥大规模语言模型的能力,从直接利用大规模语言模型进行零样本和少样本学习的基础上,逐渐扩展到利用生成式框架针对大量任务进行有监督微调的方法,有效提升了模型的性能。缩放法则(Scaling Laws)指出模型的性能依赖于模型的规模,包括:参数数量,数据集大小,和计算量,模型的效果会随着三者指数增加而线性提高,模型损失(Loss)值伴随着模型规模指数增大而线性

文章图片
#语言模型#人工智能#自然语言处理
大语言模型---第五章 有监督微调

有监督微调(Supervised Finetuning SFT)指令微调(Instruction Tunning)是指在已经训练好的语言模型基础上,通过使用有标注的特定任务数据进行进一步的微调,从而使得模型具备遵循指令的能力大模型的提示学习,语境学习能力-->高效模型微调及大语言上下文窗口扩展方法-->指令数据的一般格式与构建方式和有监督微调的代码实践1)提示学习和语境学习提示学习(Prompt-

文章图片
#语言模型#人工智能#自然语言处理
深度学习 backbone,neck,head网络关键组成

如边缘,纹理,形状等低级特征,以及物体类别,语义等高级特征。ResNet:通过残差连接解决深层网络梯度小时问题,广泛用于图像分类,目标检测等任务,例如在图像分类中,ResNet提取图像的丰富特征,最后通过全连接层输出类别概率。用于预测候选区域边界框的偏移量,调整其位置和大小,使 边界框更精确地匡助目标,输出的是坐标,宽度,高度等维度变化量,不涉及类别判断。,如分类,目标检测,语义分割等,它将nec

文章图片
#深度学习#人工智能
众擎机器人开源代码解读

(说明:“layout file”(布局文件)包含数据图表的排列、待监控的话题选择等配置,加载后无需手动设置即可直接查看预设的机器人关键数据,如关节角度、电机电流等。是用于编译机器人功能节点的脚本,“nodes” 指 ROS 2 框架中的 “节点”,是实现具体功能的可执行单元,编译后生成可运行的程序文件。是 PlotJuggler 的参数,全称 “--no-config”,表示不自动加载之前保存的

#机器人
    共 14 条
  • 1
  • 2
  • 请选择