logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

INT301 Bio-computation 生物计算(神经网络)Pt.9 自我组织特征映射(Self-Organizing Fearure Map)

自我组织映射(SOM)是一种模拟大脑神经元自组织特性的无监督学习算法。它通过竞争学习机制将高维输入数据映射到低维(通常二维)离散空间,同时保持输入数据的拓扑结构。SOM算法包含三个核心过程:竞争(选择最佳匹配神经元)、合作(激活邻近神经元)和突触适应(调整权重)。这种机制使得相似输入在输出空间中彼此靠近,形成有序的特征映射(如音调映射、视网膜映射等)。SOM通过"墨西哥帽"函数

文章图片
#神经网络#人工智能#深度学习 +1
INT305 Machine Learning 机器学习 Pt.5 神经网络(Neural network)

本文介绍了神经网络的基本原理和运算过程。首先阐述了从线性模型到多层神经网络的演化,重点讨论了Sigmoid、tanh、ReLU等多种激活函数的特点及其数学表达式。随后详细解析了神经网络的三大组成部分(输入层、隐藏层、输出层)和全连接架构。通过Python代码示例展示了前向传播的计算流程,包括权重矩阵运算和激活函数应用。文章深入讲解了损失函数(SVM损失和正则化项)的计算方法,并通过具体数值示例演示

文章图片
#机器学习#神经网络#人工智能
INT303 Big Data Analysis 大数据分析 Pt.3 数据挖掘(Data Mining)

摘要 数据挖掘是从数据中提取有用知识的过程,涉及数据收集、预处理、分析和后处理等环节。数据类型包括数值、分类、集合、依赖、空间和图数据等。数据预处理是关键步骤,包含减少数据量(采样、降维)、数据清洗和特征提取/选择。采样方法有简单随机抽样、有放回/无放回抽样、分层抽样和有偏抽样等,其中分层抽样能确保各子群体代表性。高质量的数据预处理能显著提升分析效果,但常被视为繁琐工作。

文章图片
#数据挖掘#大数据#数据分析
CAN201 Introduction to Networking(计算机网络)Pt.1 导论和应用层

因特网是一个世界范围内的计算机网络,它是一个互联了遍及全世界数十亿计算设备的网络。它为参与者提供了沟通和连接的手段。参与者可能是设备也可以是服务。这些设备包括传统的PC、服务器等,也包括如今的智能手机、平板、手表、汽车、温度调节装置等)。服务包括Web服务、电子邮件服务、域名解析服务等。应用层协议可以基于CS(客户端-服务器)架构或者P2P(对等)架构。它定义了交换信息的种类,包含request(

文章图片
#计算机网络#学习
INT303 Big Data Analysis 大数据分析 Pt.8 聚类

聚类是一种将相似数据对象分组的数据分析方法,旨在发现数据中的自然模式和内在结构。聚类问题涉及定义距离度量(如欧几里得距离、余弦距离等)来衡量对象间的相似性,并处理高维数据面临的"维度诅咒"挑战。主要应用包括星系分类、音乐推荐和文档主题分析等。聚类方法分为层次聚类(自底向上或自顶向下)和点分配聚类,其中凝聚型层次聚类通过反复合并最近聚类来构建层次结构,在非欧几里得空间则使用&qu

文章图片
#大数据#数据分析#聚类 +1
INT303 Big Data Analysis 大数据分析 Pt.9 大数据分析模型

摘要:本文系统介绍了监督学习的概念与方法。监督学习分为回归(连续目标变量)和分类(离散目标变量)两类。回归分析重点讲解了线性回归模型(包括一元和多元)、异常值处理、数据标准化以及系数解释;分类部分阐述了二分类问题的建模流程和实际应用场景。文章详细说明了监督学习的完整流程:数据划分、模型训练、性能评估和新数据预测。通过税务欺诈检测等实例,展示了分类模型在真实场景中的应用价值。文中还探讨了模型解释、显

文章图片
#大数据#数据分析#数据挖掘 +2
INT301 Bio-computation 生物计算(神经网络)Pt.7 时间序列预测、循环神经网络(Recurrent Neural Network,RNN)

本文介绍了时间序列的基本概念、模型和应用。时间序列是按时间顺序排列的观测数据,常见于股票价格、温度读数和脑电图等领域。文章阐述了时间序列建模方法,包括统计特性和平稳性假设,以及如何通过采样将连续信号离散化。重点讨论了时间序列预测问题,分析其重要性、应用场景和挑战。详细介绍了使用人工神经网络进行时间序列预测的方法,包括输入数据预处理、网络结构和训练过程。最后,文章对比了静态网络和动态网络的特点,指出

文章图片
#神经网络#人工智能#深度学习
INT303 Big Data Analysis 大数据分析 Pt.1 导论

数据科学从经验观察发展为理论分析与计算建模的跨学科领域。现代数据挖掘通过特征提取、模型训练和在线服务等流程,将海量异构数据转化为商业与科研价值。以Hubway骑行数据和社交网络推荐系统为例,展示了数据整合、特征工程和相似性分析等核心技术。面对数据缺失问题,可采用协同过滤、聚类或预测模型进行补全。数据可视化不仅辅助探索性分析,还能验证假设并指导决策。这一流程涵盖数据收集、清洗、建模到应用的全周期,需

文章图片
#大数据#数据分析
INT303 Big Data Analysis 大数据分析 Pt.10 分析模型和混合模型

本文介绍了两种经典分类方法:最近邻分类器和支持向量机(SVM)。最近邻分类器是基于实例的惰性学习器,通过计算测试样本与训练样本的距离,选取k个最近邻进行投票分类。其性能受k值选择影响,k值过小易受噪声干扰,过大可能降低准确性。SVM则是通过寻找最大化间隔的超平面实现分类,其核心是最小化||w||²/2的优化问题。两种方法各有特点:最近邻分类器实现简单但计算量大,SVM能处理高维数据但对核函数选择敏

文章图片
#大数据#数据分析#数据挖掘 +2
INT301 Bio-computation 生物计算(神经网络)Pt.10 联想存储器与HOPFIELD网络

联想存储器是一种内容可寻址的存储结构,能够通过输入模式直接匹配并回忆相关数据,而不依赖物理地址。它分为自联想和异联想两种类型:自联想存储器的输入输出模式相同,用于纠正错误或补充不完整信息;异联想存储器的输入输出模式不同,实现跨模式关联。联想存储器的核心功能包括通过部分或不完整模式回忆完整信息,其学习算法类似Hebbian规则,通过累加输入输出向量的外积计算权重矩阵。虽然主项能实现正确联想,但串扰项

文章图片
#神经网络#人工智能#深度学习
    共 47 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择