logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在大模型班学算法笔记记录-OpenCV图像色彩空间

图像梯度本质是像素值在空间维度上的变化率(导数)基础梯度:相邻像素的差值(如横向梯度=右侧像素-左侧像素,纵向梯度=下侧像素-上侧像素);梯度幅值:梯度的“大小”,代表像素值的变化程度(幅值越大,变化越剧烈);梯度方向:像素值变化最大的方向(而非简单的横向/纵向)。OpenCV图像坐标原点在左上角,尺寸表示为(H, W),像素值范围0~255(单通道),平均值可判断亮度是否正常;OpenCV默认读

文章图片
#人工智能#计算机视觉#opencv +1
在大模型班学算法笔记记录-OpenCV图像色彩空间

图像梯度本质是像素值在空间维度上的变化率(导数)基础梯度:相邻像素的差值(如横向梯度=右侧像素-左侧像素,纵向梯度=下侧像素-上侧像素);梯度幅值:梯度的“大小”,代表像素值的变化程度(幅值越大,变化越剧烈);梯度方向:像素值变化最大的方向(而非简单的横向/纵向)。OpenCV图像坐标原点在左上角,尺寸表示为(H, W),像素值范围0~255(单通道),平均值可判断亮度是否正常;OpenCV默认读

文章图片
#人工智能#计算机视觉#opencv +1
在大模型班学算法笔记记录-神经网络

神经网络的结构本质是“带权重的有向Graph”,Tree是其无回路的特殊形式;神经元是“迷你函数单元”,核心遵循“线性变换(加权求和+偏置)→非线性变换(激活函数)”的标准流程——线性变换负责整合特征,非线性变换负责拟合复杂关系,二者共同构成了神经网络的计算基础。

文章图片
#人工智能#神经网络#深度学习 +1
在大模型班学算法笔记记录-神经网络

神经网络的结构本质是“带权重的有向Graph”,Tree是其无回路的特殊形式;神经元是“迷你函数单元”,核心遵循“线性变换(加权求和+偏置)→非线性变换(激活函数)”的标准流程——线性变换负责整合特征,非线性变换负责拟合复杂关系,二者共同构成了神经网络的计算基础。

文章图片
#人工智能#神经网络#深度学习 +1
在大模型班学算法的笔记记录-逻辑回归

逻辑回归二元分类的损失函数是二元交叉熵,单个样本为,整体为所有样本的平均值;二元交叉熵不适用于多分类,会导致概率和不为1,多分类应使用Softmax+多分类交叉熵;MSE不推荐做分类,核心问题是损失非凸、易梯度消失、对异常值敏感;三种梯度下降的核心差异是迭代样本量:BGD用全量(稳定但慢)、SGD用单个(快但波动大)、MBGD用小批量(平衡最优)。

文章图片
#人工智能#机器学习
在大模型班学算法的笔记记录-逻辑回归

逻辑回归二元分类的损失函数是二元交叉熵,单个样本为,整体为所有样本的平均值;二元交叉熵不适用于多分类,会导致概率和不为1,多分类应使用Softmax+多分类交叉熵;MSE不推荐做分类,核心问题是损失非凸、易梯度消失、对异常值敏感;三种梯度下降的核心差异是迭代样本量:BGD用全量(稳定但慢)、SGD用单个(快但波动大)、MBGD用小批量(平衡最优)。

文章图片
#人工智能#机器学习
在大模型班学算法的笔记记录-机器学习

三大问题是机器学习的“基础框架”:按「有无标签」「标签类型」划分,回归(连续标签)、分类(离散标签)属于有监督学习,聚类(无标签)属于无监督学习;五大任务是“落地形态”:分类是基础,检测(分类+定位)、分割(像素级分类)、关键点识别(结构级分类)是分类任务的延伸,目标追踪是检测任务在时序维度的拓展;学习关键:区分任务的核心“输出结果形态”——连续数值(回归)、离散类别(分类)、簇编号(聚类)、边界

文章图片
#人工智能#机器学习#目标检测 +3
在大模型班学算法的笔记记录-机器学习

三大问题是机器学习的“基础框架”:按「有无标签」「标签类型」划分,回归(连续标签)、分类(离散标签)属于有监督学习,聚类(无标签)属于无监督学习;五大任务是“落地形态”:分类是基础,检测(分类+定位)、分割(像素级分类)、关键点识别(结构级分类)是分类任务的延伸,目标追踪是检测任务在时序维度的拓展;学习关键:区分任务的核心“输出结果形态”——连续数值(回归)、离散类别(分类)、簇编号(聚类)、边界

文章图片
#人工智能#机器学习#目标检测 +3
到底了