logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习技术-层次聚类算法(组平均)-综合层次聚类方法(BIRCH、CURE)

基于层次的聚类方法,是对给定的数据进行层次的分解,直到某种条件满足为止。首先将数据点组成一颗聚类树,根据层次,自底向上或是自顶向下分解。层次的方法可以分为凝聚的方法和分裂的方法。凝聚的方法,也称为自底向上的方法,初始时每个数据点都被看成是单独的一个簇,然后通过逐步合并相近的数据点或簇,形成越来越大的簇,直到所有的数据点都在一个簇中,或者达到某个终止条件为止。凝聚的方法:步骤1:用异常侦测等方法去离

#聚类#算法#机器学习
机器学习-分类和预测(logistic回归、支持向量机)

分类问题是通俗易懂的问题,分类技术是应用广泛的方法和手段。我们把分类和预测统称为推测。分类就是应用已知的一些属性数据去推测一个未知的离散型的属性数据,而这个被推测的属性数据的可取值是预先定义的。要很好地实现这种推测,就需要事先在已知的一些属性和未知的离散型属性之间建立一个有效的模型,即分类模型。可用于分类的算法有决策树、朴素贝叶斯分类、神经网络、logistic回归、支持向量机等。用于预测的模型的

#机器学习#算法
机器学习-关联规则(Apriori算法和FP-树频集算法)

1.关联规则世间万物普遍存在着联系,有些联系是我们知道的,比如说有些疾病有遗传问题、肺癌跟吸烟习惯有关联等。更多的联系是我们现在还未知的,需要我们去探索的。机器学习的关联规则算法,可以发现大量数据中项集之间有趣的未知联系。通过关联规则可以发现未知的、想象不到的联系。例如,药品于疗效之间的联系。某医药公司研究了一种治疗心脏病的药物,通过临床数据检验发现对于心脏病疗效不明显,但通过关联规则挖掘后发现对

#机器学习#算法
机器学习-时间序列(灰色系统预测模型)

机器学习的一个重要方向是序列模式探索,典型的序列模式探索包括时间序列分析和非时间序列分析。其中,大量的时间序列问题广泛分布在实现生活的许多领域中,对时间序列的分析我们也称之为趋势预测探索、更复杂的非平稳时间序列模型等。机器学习应用中,比较复杂的平稳时间序列模型、更复杂的非平稳时间序列模型等。机器学习应用中,比较常用的趋势预测探索方法有自回归平均移动模型(ARIMA)、灰色系统预测模型(GM)等。其

#机器学习
机器学习-密度聚类算法(DBSCAN)

1.密度聚类基于密度的聚类算法由于能够发现任意形状的聚类,识别数据集中的噪声点,可伸缩性好等特点,在许多领域有着重要的应用。密度算法概念:1)如果一个数据点周围足够稠密,也就是以这个点为中心,给定半径的邻域内的数据点足够多,密度大于密度阈值(用户指定的参数MinPts),则称这个数据点为核心数据点,否则为边界数据点。2)研究数据点之间的关系,如果p是一个核心数据点,q属性p的yita邻域,则称q是

机器学习-时间序列(灰色系统预测模型)

机器学习的一个重要方向是序列模式探索,典型的序列模式探索包括时间序列分析和非时间序列分析。其中,大量的时间序列问题广泛分布在实现生活的许多领域中,对时间序列的分析我们也称之为趋势预测探索、更复杂的非平稳时间序列模型等。机器学习应用中,比较复杂的平稳时间序列模型、更复杂的非平稳时间序列模型等。机器学习应用中,比较常用的趋势预测探索方法有自回归平均移动模型(ARIMA)、灰色系统预测模型(GM)等。其

#机器学习
机器学习-特征抽取(主成分分析法/因子分析法/非负矩阵因子分解NMF算法)

1.特征抽取:特征抽取是机器学习中另一种十分有用的方法,它与特性选择不同,特征抽取是对数据的特征进行概括和总结,而特性选择则主要是对数据中的不同特征进行比较和选取。特征抽取是机器学习技术中的一个常用的方法,它是一个属性降维的过程,特征抽取实际上是变换属性。经变换了的属性,或特性,是原来属性集的线性合并。特征抽取会导致更小更精的一组属性。用特征抽取建立的模型可能是质量更好的,因为数据被更少的和更有意

#算法#机器学习
机器学习-ARIMA模型预测

ARIMA模型全称是自回归移动平均模型(Autoregressive Integrated Moving Average Model),它是处理带有趋势、季节因素平稳随机项数据的模型。ARIMA的一般模型为ARIMA(p,d.q),称为差分自回归移动平均模型,AR是自回归,P为自回归项,MA为移动平均,q为移动平均项数,d为时间序列平稳时所做的差分次数。1.ARIMA模型的核心思想:ARIMA模型

#机器学习
机器学习-密度聚类算法(DBSCAN)

1.密度聚类基于密度的聚类算法由于能够发现任意形状的聚类,识别数据集中的噪声点,可伸缩性好等特点,在许多领域有着重要的应用。密度算法概念:1)如果一个数据点周围足够稠密,也就是以这个点为中心,给定半径的邻域内的数据点足够多,密度大于密度阈值(用户指定的参数MinPts),则称这个数据点为核心数据点,否则为边界数据点。2)研究数据点之间的关系,如果p是一个核心数据点,q属性p的yita邻域,则称q是

Latex 的基本语法

1.文本\排版:1.定版型:documentclass[A]{B}A: 1. 字体10pt(默认值),11pt,12pt,例子:\documentclass[11pt]{article};2.纸张大小有几个,最常见的就是a4paper,letterpaper(默认值),例子:\documentclass[a4paper]{article};3.单双面oneside(article,report(默

    共 14 条
  • 1
  • 2
  • 请选择