logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

神经网络中的非线性激活函数:从原理到实践

本文深入探讨了神经网络中激活函数的核心作用。非线性激活函数赋予神经网络学习复杂模式的能力,避免了仅能进行线性变换的局限。文章详细解析了Sigmoid、Tanh、ReLU及其变体等多种激活函数的特性、适用场景和优缺点,并给出了不同情境下的选择策略。通过可视化代码直观展示了各函数的形状特征,帮助理解其数学本质。最后强调,激活函数是神经网络的"灵魂",合理选择对模型性能至关重要,需要

文章图片
#神经网络#人工智能#深度学习 +4
神经网络中的 HWC→CHW 格式转换

HWC(高度、宽度、通道)和CHW(通道、高度、宽度)是神经网络中两种数据格式。CHW格式更符合主流框架(如PyTorch)要求,能提升计算效率,减少内存访问延迟,并与预训练模型兼容。转换方法包括使用NumPy的transpose或PyTorch的permute函数进行维度置换。CHW格式有利于优化GPU计算性能,适配深度学习框架的卷积操作要求。

文章图片
#神经网络#人工智能#深度学习
自蒸馏学习方法

自蒸馏学习是一种模型优化方法,通过让模型自身充当"教师"和"学生"角色,将知识从复杂模型传递到简化版本。核心是利用软化标签传递类别关联信息,结合蒸馏损失和原始损失进行训练。该方法具有轻量化、自监督和强泛化特点,适用于模型压缩、提升小模型性能及半监督学习场景。典型实现包括同模型层间蒸馏、多阶段自蒸馏等。关键参数需调节温度系数和损失权重,确保教师模型稳定性和结构

文章图片
#学习方法#人工智能#算法
迁移学习(Transfer Learning)

摘要:迁移学习是一种利用预训练模型解决目标任务的深度学习技术。其核心原理是通过复用预训练模型在源任务(如100万张图像分类)中学习到的通用特征(边缘、角点等),仅微调输出层或部分网络参数来适配目标任务(如小规模数字分类)。该技术能显著降低训练成本,在小数据场景(如仅50张图像)下仍能取得良好效果,适用于图像、文本等输入类型相同的任务迁移。标准流程包括选择预训练模型和目标任务微调两个阶段。

文章图片
#迁移学习#人工智能#机器学习
(详解)数据结构线性表的创建——前插法、后插法

前插法又称头插法,后插法又称尾插法。前插法与后插法属于链表的创建方法。链表的创建与顺序表不同,链表是一种动态结构。整个可用存储空间可以为多个 链表共同享用,每个链表不需要像顺序表那样提前分配好占用空间,而是由系统按照需求即使生成。即从空表的初始化后,依次建立各元素结点,并逐个插入链表。

文章图片
#数据结构#算法#学习
多分类(Multiclass Classification)&多标签分类(Multi-label Classification)

多分类与多标签分类技术解析 摘要:本文系统介绍了两种常见分类任务。多分类任务通过Softmax回归将样本划分到互斥类别中,详细阐述了Softmax函数原理、神经网络实现及数值优化技巧。多标签分类则处理样本可同时属于多个类别的情况,采用Sigmoid激活函数和二元交叉熵损失,介绍了独立模型和共享特征两种建模方法。文章比较了两类任务的差异,包括类别关系、标签形式、激活函数选择等,并提供了TensorF

文章图片
#分类#数据挖掘#人工智能
神经网络学习笔记

本文介绍了神经网络的基本原理与应用。神经网络由输入层、隐藏层和输出层构成,通过权重连接和激活函数实现非线性变换。核心内容包括神经元计算、正向传播过程和典型应用场景(需求预测、人脸识别、手写数字识别)。文章详细演示了使用TensorFlow和NumPy实现神经网络的步骤,比较了向量化与循环计算的性能差异,并简要介绍了CNN、RNN等进阶方向。

文章图片
#神经网络#学习
RGB-D

摘要:RGB-D技术融合彩色图像(RGB)与深度信息(Depth),使机器具备三维感知能力。该技术主要包括四种硬件方案(结构光、ToF、双目视觉、LiDAR),通过不同原理获取深度数据。核心数据处理包含畸变校正、去噪、配准等预处理步骤,并支持三维重建、目标检测、姿态估计等算法应用。技术指标如深度范围、精度、帧率等决定了设备适用场景,目前在消费电子、机器人、医疗等领域广泛应用。未来发展趋势包括多传感

文章图片
#计算机视觉#人工智能
信息增益(Information Gain)

信息增益是决策树选择分裂特征的核心指标,通过计算特征分裂前后熵的减少量来评估其分类价值。本文以"耳朵形状"特征为例详细演示了信息增益的计算流程:先计算父节点熵(1),再按特征取值划分样本集并计算子节点熵(尖的0.72,下垂的0.72),最后得到信息增益0.28。对比计算"脸型"特征也得到相同结果。关键点在于特征分裂后子节点加权熵之和越小,说明该特征分类能力越

文章图片
#深度学习#机器学习#python +2
ML:Supervised/Unsupervised

本文辨析了人工智能领域的核心概念。机器学习(ML)是实现AI的核心技术手段,通过数据驱动算法优化模型,分为监督学习(预测标签)和无监督学习(探索数据结构)。通用人工智能(AGI)是终极目标,指具备人类水平的通用智能,目前尚未实现。文章还介绍了监督学习的回归与分类任务,无监督学习的聚类与降维技术,以及异常检测等关键应用领域。最后通过框架图总结了AI、AGI和ML之间的层级关系。

文章图片
#机器学习
    共 15 条
  • 1
  • 2
  • 请选择