Prayer41 个人主页

@Prayer41

Prayer41

2022-12-18 21:09:01 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

神经网络中的非线性激活函数：从原理到实践

本文深入探讨了神经网络中激活函数的核心作用。非线性激活函数赋予神经网络学习复杂模式的能力，避免了仅能进行线性变换的局限。文章详细解析了Sigmoid、Tanh、ReLU及其变体等多种激活函数的特性、适用场景和优缺点，并给出了不同情境下的选择策略。通过可视化代码直观展示了各函数的形状特征，帮助理解其数学本质。最后强调，激活函数是神经网络的"灵魂"，合理选择对模型性能至关重要，需要

#神经网络 #人工智能 #深度学习 +4

神经网络中的 HWC→CHW 格式转换

HWC（高度、宽度、通道）和CHW（通道、高度、宽度）是神经网络中两种数据格式。CHW格式更符合主流框架（如PyTorch）要求，能提升计算效率，减少内存访问延迟，并与预训练模型兼容。转换方法包括使用NumPy的transpose或PyTorch的permute函数进行维度置换。CHW格式有利于优化GPU计算性能，适配深度学习框架的卷积操作要求。

#神经网络 #人工智能 #深度学习

自蒸馏学习方法

自蒸馏学习是一种模型优化方法，通过让模型自身充当"教师"和"学生"角色，将知识从复杂模型传递到简化版本。核心是利用软化标签传递类别关联信息，结合蒸馏损失和原始损失进行训练。该方法具有轻量化、自监督和强泛化特点，适用于模型压缩、提升小模型性能及半监督学习场景。典型实现包括同模型层间蒸馏、多阶段自蒸馏等。关键参数需调节温度系数和损失权重，确保教师模型稳定性和结构

#学习方法 #人工智能 #算法

迁移学习（Transfer Learning）

摘要：迁移学习是一种利用预训练模型解决目标任务的深度学习技术。其核心原理是通过复用预训练模型在源任务（如100万张图像分类）中学习到的通用特征（边缘、角点等），仅微调输出层或部分网络参数来适配目标任务（如小规模数字分类）。该技术能显著降低训练成本，在小数据场景（如仅50张图像）下仍能取得良好效果，适用于图像、文本等输入类型相同的任务迁移。标准流程包括选择预训练模型和目标任务微调两个阶段。

#迁移学习 #人工智能 #机器学习

（详解）数据结构线性表的创建——前插法、后插法

前插法又称头插法，后插法又称尾插法。前插法与后插法属于链表的创建方法。链表的创建与顺序表不同，链表是一种动态结构。整个可用存储空间可以为多个链表共同享用，每个链表不需要像顺序表那样提前分配好占用空间，而是由系统按照需求即使生成。即从空表的初始化后，依次建立各元素结点，并逐个插入链表。

#数据结构 #算法 #学习

多分类（Multiclass Classification）&多标签分类（Multi-label Classification）

多分类与多标签分类技术解析摘要：本文系统介绍了两种常见分类任务。多分类任务通过Softmax回归将样本划分到互斥类别中，详细阐述了Softmax函数原理、神经网络实现及数值优化技巧。多标签分类则处理样本可同时属于多个类别的情况，采用Sigmoid激活函数和二元交叉熵损失，介绍了独立模型和共享特征两种建模方法。文章比较了两类任务的差异，包括类别关系、标签形式、激活函数选择等，并提供了TensorF

#分类 #数据挖掘 #人工智能

神经网络学习笔记

本文介绍了神经网络的基本原理与应用。神经网络由输入层、隐藏层和输出层构成，通过权重连接和激活函数实现非线性变换。核心内容包括神经元计算、正向传播过程和典型应用场景（需求预测、人脸识别、手写数字识别）。文章详细演示了使用TensorFlow和NumPy实现神经网络的步骤，比较了向量化与循环计算的性能差异，并简要介绍了CNN、RNN等进阶方向。

#神经网络 #学习

RGB-D

摘要：RGB-D技术融合彩色图像（RGB）与深度信息（Depth），使机器具备三维感知能力。该技术主要包括四种硬件方案（结构光、ToF、双目视觉、LiDAR），通过不同原理获取深度数据。核心数据处理包含畸变校正、去噪、配准等预处理步骤，并支持三维重建、目标检测、姿态估计等算法应用。技术指标如深度范围、精度、帧率等决定了设备适用场景，目前在消费电子、机器人、医疗等领域广泛应用。未来发展趋势包括多传感

#计算机视觉 #人工智能

信息增益（Information Gain）

信息增益是决策树选择分裂特征的核心指标，通过计算特征分裂前后熵的减少量来评估其分类价值。本文以"耳朵形状"特征为例详细演示了信息增益的计算流程：先计算父节点熵(1)，再按特征取值划分样本集并计算子节点熵(尖的0.72，下垂的0.72)，最后得到信息增益0.28。对比计算"脸型"特征也得到相同结果。关键点在于特征分裂后子节点加权熵之和越小，说明该特征分类能力越

#深度学习 #机器学习 #python +2

ML：Supervised/Unsupervised

本文辨析了人工智能领域的核心概念。机器学习（ML）是实现AI的核心技术手段，通过数据驱动算法优化模型，分为监督学习（预测标签）和无监督学习（探索数据结构）。通用人工智能（AGI）是终极目标，指具备人类水平的通用智能，目前尚未实现。文章还介绍了监督学习的回归与分类任务，无监督学习的聚类与降维技术，以及异常检测等关键应用领域。最后通过框架图总结了AI、AGI和ML之间的层级关系。

#机器学习

共 15 条

请选择