
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
图像梯度本质是像素值在空间维度上的变化率(导数)基础梯度:相邻像素的差值(如横向梯度=右侧像素-左侧像素,纵向梯度=下侧像素-上侧像素);梯度幅值:梯度的“大小”,代表像素值的变化程度(幅值越大,变化越剧烈);梯度方向:像素值变化最大的方向(而非简单的横向/纵向)。OpenCV图像坐标原点在左上角,尺寸表示为(H, W),像素值范围0~255(单通道),平均值可判断亮度是否正常;OpenCV默认读

图像梯度本质是像素值在空间维度上的变化率(导数)基础梯度:相邻像素的差值(如横向梯度=右侧像素-左侧像素,纵向梯度=下侧像素-上侧像素);梯度幅值:梯度的“大小”,代表像素值的变化程度(幅值越大,变化越剧烈);梯度方向:像素值变化最大的方向(而非简单的横向/纵向)。OpenCV图像坐标原点在左上角,尺寸表示为(H, W),像素值范围0~255(单通道),平均值可判断亮度是否正常;OpenCV默认读

神经网络的结构本质是“带权重的有向Graph”,Tree是其无回路的特殊形式;神经元是“迷你函数单元”,核心遵循“线性变换(加权求和+偏置)→非线性变换(激活函数)”的标准流程——线性变换负责整合特征,非线性变换负责拟合复杂关系,二者共同构成了神经网络的计算基础。

神经网络的结构本质是“带权重的有向Graph”,Tree是其无回路的特殊形式;神经元是“迷你函数单元”,核心遵循“线性变换(加权求和+偏置)→非线性变换(激活函数)”的标准流程——线性变换负责整合特征,非线性变换负责拟合复杂关系,二者共同构成了神经网络的计算基础。

逻辑回归二元分类的损失函数是二元交叉熵,单个样本为,整体为所有样本的平均值;二元交叉熵不适用于多分类,会导致概率和不为1,多分类应使用Softmax+多分类交叉熵;MSE不推荐做分类,核心问题是损失非凸、易梯度消失、对异常值敏感;三种梯度下降的核心差异是迭代样本量:BGD用全量(稳定但慢)、SGD用单个(快但波动大)、MBGD用小批量(平衡最优)。

逻辑回归二元分类的损失函数是二元交叉熵,单个样本为,整体为所有样本的平均值;二元交叉熵不适用于多分类,会导致概率和不为1,多分类应使用Softmax+多分类交叉熵;MSE不推荐做分类,核心问题是损失非凸、易梯度消失、对异常值敏感;三种梯度下降的核心差异是迭代样本量:BGD用全量(稳定但慢)、SGD用单个(快但波动大)、MBGD用小批量(平衡最优)。

三大问题是机器学习的“基础框架”:按「有无标签」「标签类型」划分,回归(连续标签)、分类(离散标签)属于有监督学习,聚类(无标签)属于无监督学习;五大任务是“落地形态”:分类是基础,检测(分类+定位)、分割(像素级分类)、关键点识别(结构级分类)是分类任务的延伸,目标追踪是检测任务在时序维度的拓展;学习关键:区分任务的核心“输出结果形态”——连续数值(回归)、离散类别(分类)、簇编号(聚类)、边界

三大问题是机器学习的“基础框架”:按「有无标签」「标签类型」划分,回归(连续标签)、分类(离散标签)属于有监督学习,聚类(无标签)属于无监督学习;五大任务是“落地形态”:分类是基础,检测(分类+定位)、分割(像素级分类)、关键点识别(结构级分类)是分类任务的延伸,目标追踪是检测任务在时序维度的拓展;学习关键:区分任务的核心“输出结果形态”——连续数值(回归)、离散类别(分类)、簇编号(聚类)、边界

转行学习笔记分享

转行学习笔记分享








