
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
监督学习给机器的训练数据拥有“标记”或者“答案”。就比如上图的MNIST数据集,我们需要给出每一行所对应的数字,机器才能学习。这里监督的意思就是我们人类给机器的信息已经进行了正确答案的划分。例:银行已经积累了一定的客户信息和他们信用卡的信用情况。监督学习主要处理的是分类和回归问题。算法:k邻近,线性回归和多项式回归,逻辑回归,SVM,决策树和随机森林。在以后的文章中我们都会慢慢介绍。非监督学习给机
基本概念如上图中为著名的鸢尾花数据,下面围绕鸢尾花我门来了解一些定义:数据整体叫做数据集。每一行数据为一个样本。除最后一列为,每一列表达为样本的一个特征。最后一列称为标记。如果我们选取第一列和第二列的数据建立关系,可以得到下面的图,这个图也被称为特征空间。根据这个特征空间我没可以明显的看出鸢尾花被分为两类,一类我们标记为红色,一类标记为蓝色。然后我们可以通过一条直线将他划分为两部分,得到下图:将他
蓝桥天梯常用STL库,vector,set,map,queue,stack

定义主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。数据降维的作用降维是将高维度的数据(指标太多)保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产
问题简介既要xxx,又要xxx。例:某工厂生产产品I和产品II,有关数据如下,若要满足以下三个条件:1.尽量使产品I的产量不超过产品II的产量;2.尽可能充分利用所有设备;3.尽可能使利润不少于56万。那么我们该如何建立模型呢?注:需要衡量每个目标的完成情况,并主管上区分三个目标的重要性,使得整体的完成情况尽量好。、接下来介绍几个重要的概念:1.正负偏差变量:正偏差就是超过目标的值的量,比如这个问







