logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

记录科研问题——RTX5090用于视觉模型训练的问题

网上查了,需要安装pytorch2.7+cuda12.8,pytorch2.7以上才可以,回想起来还好是10月份拿到的设备,如果是2、3月份,估计就歇菜了,看了nvidia官方的内容,pytorch上半年还不支持sm_120,conda和pip命令现在也不行,deepseek和chatgpt给出的命令也都安装不进去,清华的源和好几个国内的源都试了,也不行,网上让用nightly版本,不停的提示轮子

文章图片
#人工智能#python
什么是强化学习-Reinforcement Learning(RL)

学习者(比如那只狗,或者你的AI模型)。智能体所处的场景(比如房间)。智能体能做的事情(跑、跳、坐)。环境给出的反馈分数(+1分,-10分)。除非你的问题是一个需要连续决策的问题(如机器人控制、物流调度),且你拥有一个高保真的模拟环境,否则不要使用强化学习。它会把简单的问题复杂化,且大概率训练不出来。

文章图片
#人工智能
什么是强化学习-Reinforcement Learning(RL)

学习者(比如那只狗,或者你的AI模型)。智能体所处的场景(比如房间)。智能体能做的事情(跑、跳、坐)。环境给出的反馈分数(+1分,-10分)。除非你的问题是一个需要连续决策的问题(如机器人控制、物流调度),且你拥有一个高保真的模拟环境,否则不要使用强化学习。它会把简单的问题复杂化,且大概率训练不出来。

文章图片
#人工智能
到底了