
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
吴恩达《深度学习》之看懂注意力机制的“精准一瞥”
多头注意力机制。语言是极其复杂的。当我们看到一句话里的某个词时,我们往往需要同时关注很多不同的维度。比如看这句话:“那只巨大的猫懒洋洋地躺在垫子上,它刚刚吃了鱼。当我们盯着“猫”我们的左眼可能需要关注它的修饰语(什么猫?——巨大的猫);我们的右眼可能需要追踪它的代词指代(谁吃了鱼?——“它”指的是猫)。如果我们只有“一双眼睛”(单头注意力机制),网络在同一时间只能计算出一组α\alphaα。它如果
吴恩达《深度学习》之看懂神经网络的“底层细胞”:逻辑回归
文章摘要: 逻辑回归(Logistic Regression)是深度学习的核心基础,其本质是通过Sigmoid函数将线性得分$z=w^Tx+b$映射为0~1的概率值,解决二分类问题。关键点包括: 直觉:Sigmoid函数($\sigma(z)=\frac{1}{1+e^{-z}}$)将任意实数平滑转化为概率,如$z\to+\infty$输出1,$z\to0$输出0.5。 数学核心:通过概率输出(如
到底了







