
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
python:torch.no_grad()的作用 + requires_grad,grad_fn,grad的含义及使用
保证param原地数值改变操作下requires_grad=True不变。
深度学习基础:矩阵求导+反向传播
重点:向量对向量求导a = , 向量a对向量W求导,导数为WT.当自变量和因变量均为向量时,求导结果为一个矩阵,我们称该矩阵为雅可比矩阵(Jacobian Matrix)。
到底了







