
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一元线性回归中,残差ei的期望E(ei)=_0;在回归分析中,若存在异方差问题,则应利用_加权最小二乘法处理.;在多元线性回归分析中,若|XX |≈0会导致_多重共线性,其中X为设计矩阵.回归分析中常用的样本数据分为时间序列数据与_横截面数据_.现代统计学中研究统计关系的两个重要分支是_回归分析_和_相关分析.回归分析是处理变量间_相关分析关系_的一种数理统计方法.归分析中的异方差问题会造成以下三
Spark大数据技术与应用第一章Spark简介与运行原理1.Spark是2009年由马泰·扎哈里亚在美国加州大学伯克利分校的AMPLab实验室开发的子项目,经过开源后捐赠给Aspache软件基金会,成为了Apache Spark。由Scala语言实现的专门为大规模数据处理而设计的快速通用的计算引擎。2.Spark的三个特点:(1)易于使用Spark提供高级应用程序编程接口(2)计算速度快,支持交互

数据预处理1.什么是数据预处理:从初始数据到得出分析或挖掘结果的整个过程中对数据经过的一系列操作称为数据预处理。2.常见的数据问题:数据缺失,数据重复,数据异常,数据冗余,数据值冲突,数据噪声3.数据预处理的流程:初始数据获取,数据清理,数据集成,数据变换,数据规约4.大数据项目开发流程:数据采集,数据预处理,数据存储,数据分析挖掘,数据可视化5.数据质量问题:准确性,相关性,完整性,时效性,一致
目录时间序列概念1.时间序列数据分类2.时间序列数据可视化的作用连续型数据2.折线图3.阶梯图离散型时间序列数据1.柱形图2. 分组柱形图3.堆叠柱形图4.散点图时间序列概念时间序列数据又称“时序数据”,是按时间顺序排列的一系列数据值。与一般的数据不同,时序数据中的时间是一个非常重要的维度与属性。1.时间序列数据分类时间分为时间段和时刻,多个时刻构成时间段,从数据类型上可以分为离散型时间序列数据和
目录一、比例数据可视化1.比例数据的分组依据2.比例数据的应用二、饼图1.定义2.饼图的基本构架3.关于饼图的使用建议如下:三、环形图四、百分比堆叠柱形图2.百分比堆叠柱形图对于要展示数值累积的总数进行弱化,重点突出类别分布在整体中的作用,应用场景如下:3.关于百分比堆叠柱形图的使用建议有以下几条:五、百分比堆叠面积图1.概念2.百分比堆叠面积图的使用建议如下:六、矩形树图1.概念:七、 雷达图1
一、视觉感知1.低级和高级视觉视觉低级:与物体性质相关。视觉高级:对物体的识别和分类视觉感知是指客观事物通过人的视觉器官在人脑中形成的直接反映,人类只有通过“视觉感知”才能达到“视觉认知”。2.格式塔原则包括以下基本原则:接近原则 相似原则 闭合原则 连续原则3.颜色理论1.三基色原理:红绿蓝2.色彩三要素:色相、明度和饱和度二、数据准备1.数据类型:根据数据模型分为:浮点型、整数、字符根据测量标
数据挖掘第一章1.什么是数据挖掘数据挖掘是从数据中,发现其有用的信息,从而帮助我们做出决策(广义角度)数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识,寻找其规律的技术,结合统计学、机器学习和人工智能技术的综合的过程(技术角度)2.数据挖掘是一个综合性的交叉学科,所涉及的学科领域有哪些?统计学、机器学习、数据结构、
数据挖掘第一章1.什么是数据挖掘数据挖掘是从数据中,发现其有用的信息,从而帮助我们做出决策(广义角度)数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识,寻找其规律的技术,结合统计学、机器学习和人工智能技术的综合的过程(技术角度)2.数据挖掘是一个综合性的交叉学科,所涉及的学科领域有哪些?统计学、机器学习、数据结构、
目录一、比例数据可视化1.比例数据的分组依据2.比例数据的应用二、饼图1.定义2.饼图的基本构架3.关于饼图的使用建议如下:三、环形图四、百分比堆叠柱形图2.百分比堆叠柱形图对于要展示数值累积的总数进行弱化,重点突出类别分布在整体中的作用,应用场景如下:3.关于百分比堆叠柱形图的使用建议有以下几条:五、百分比堆叠面积图1.概念2.百分比堆叠面积图的使用建议如下:六、矩形树图1.概念:七、 雷达图1