logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

浅谈 强化学习

找到一个策略 π,使得长期累积奖励的期望最大:(γ 叫折扣因子,通常 0.95~0.99,代表“未来的奖励要打折”)强化学习 = 通过大量试错 + 稀疏的奖励信号,学会在没有标准答案的情况下做出长期最优决策。强化学习├── 基于价值(Value-based)├── 基于策略(Policy-based)│ └── Actor-Critic 家族(A2C / A3C / PPO / SAC / TD3

#人工智能
小绿鲸免费领取200M网盘容量

科研 #研究生 #研究生开学 #文献阅读 #科研狗 #小绿鲸 #组会 #研究生互助。注册时填写我的邀请码 H9yTg,双方各得200M网盘容量。

#论文阅读
docker save太大,查看进度

导出大镜像(20GB)时,由于数据量大,确实可能长时间没有输出,让人误以为卡住。对于 20GB 的大镜像,导出可能需要几分钟到几十分钟不等,具体取决于磁盘性能和系统负载。如果长时间无响应,建议检查系统资源(内存、磁盘空间)或尝试优化导出方式。在 Windows 上,可以打开任务管理器 → 性能 → 磁盘,查看磁盘活动是否持续。定期执行此命令,观察文件大小是否逐渐增加。如果在增长,说明导出正在进行中

#docker#容器#运维
防火墙关闭

在 CentOS 7 中,防火墙服务通常是由firewalld提供的。如果你希望。

#网络
在git仓库新建分支之后,Vscode里面看不到

在仓库新建了分支但是在Vscode里面看不到这个新建的分支。

文章图片
#vscode
vscode设置代码模板

一键生成Vue3等自定义模板代码。vscode提高效率必备技能,超使用!!

文章图片
#vscode#vue.js#ide
git 提交报错 和命令之间的区别

提交更改:如果你想保留你在"src/views/PopupTest/index.vue"文件中所做的更改并在合并后继续使用它们,你可以先提交这些更改,然后再执行合并操作。命令,你可以将当前的修改暂时保存起来,并将工作目录恢复到上一个提交的状态。储藏更改:如果你不想将本地更改提交,而是暂时存储这些更改并在合并后再应用它们,你可以使用"git stash"命令。在 Git 中,为了将修改提交到版本历史

文章图片
#git
vllm系统架构图解释

要理解,我们可以从。

#系统架构
vllm架构图

要理解,我们可以从。

    共 75 条
  • 1
  • 2
  • 3
  • 8
  • 请选择