logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

线性回归异常值分析之—高杠杆点、离群点、强影响点

离群点、高杠杆点、强影响点,都是数据观测中常见的异常数据形式,下面分别从概念,检测方法和处理方法三方面来谈论一 概念离群点:残差很大的观测虚线和实线分别是包含红点在内和不包含红点在内训练出来的回归模型。可以看到,两条回归线之间相差不大,因此,该红点不是强影响点。同时,该红点并没有离其他自变量的值很远,因此也不是高杠杆点。但是它离回归线很远(残差大),因此该红点是离群点。高杠杆点:x空间中异常的观测

文章图片
#机器学习#算法#数据挖掘
Xgboost回归四种调参方法及Python简单实现

前言Xgboost对特征工程和数据处理比较友好,相比之下调参成为用好Xgboost重要的一环,本文分别从参数、调参方法、Python实现的维度进行梳理,作为调参思路的记录。本文将关注以下几个问题:1.Xgboost哪些参数需要调参?2.通用的调参方法有哪些 ? 如何实现?Xgboost哪些参数需要调参?下表列出了 xgboost 0.90版本下 xgboost.sklearn 中 XGBBaseM

文章图片
#回归#机器学习#算法 +1
ARIMA模型的Python实现

from __future__ import print_functionimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima_model import ARIMA"""ARIMA模型Python实现ARIMA模型基本假设:1.数据平稳性2.白

文章图片
#python#开发语言#后端
多元线性回归之基本假定的验证和处理办法

前言多元线性回归模型统计推断结果的可靠性,建立在一些统计假设的基础上,只有在假设条件满足时,模型输出结果才成立,本文将展开讨论多元线性回归有哪些基本假设、如何检验假设是否成立、以及当基本假设不满足时的处理方案。同时需要说明的是,轻微违背假设并不会对主要的分析结果产生重大的影响,这是最小二乘法的一个特点,但是如果严重违背基本假设就会极大的破坏结果的合理性。一 基本假定(一)误差的假定1、服从正态分布

#机器学习#人工智能#python +2
暂无文章信息