
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习--4.策略梯度方法(蒙特卡罗)
强化学习 策略梯度方法(蒙特卡罗)
强化学习--6.算法分类及优化原理
强化学习--6.算法分类及优化原理
4、opencv图像相似度
opencv
8、opencv图像分割合并
opencv
25、DeepSeek-R1论文笔记
DeepSeek-R1论文笔记
24、DeepSeek-V3论文笔记
DeepSeek-V3论文笔记
19、DeepSeek LLM论文笔记
DeepSeek LLM论文笔记
26、DAPO论文笔记(解耦剪辑与动态采样策略优化,GRPO的改进)
DAPO论文笔记(解耦剪辑与动态采样策略优化,GRPO的改进)
RoPE(旋转位置编码,参考:DeepSeek-V2)
RoPE(旋转位置编码,参考:DeepSeek-V2)







