
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
刚学数据分析时做的小例子,从notebook上复制过来,留个纪念~数据集是从UCI上download下来的Wine数据集,下载地址,这是一个多分类问题,类别标签为1,2,3。先瞅瞅数据,import numpy as npimport pandas as pdfrom sklearn.linear_model import LogisticRegression#逻辑斯特回归...
详细介绍可以看seaborn官方API和example galler。1 set_style( ) set( )set_style( )是用来设置主题的,Seaborn有五个预设好的主题: darkgrid , whitegrid , dark , white ,和 ticks 默认: darkgriimport matplotlib.pyplot as plt impor...
图例和注解清晰连贯地解释了数据图表的内容。通过给所显示的数据进行简短的描述,可以让观察者更容易理解。import matplotlib.pyplot as pltimport numpy as np# generate different normal distributionsx1 = np.random.normal(30, 3, 100)x2 = np.random.norma...
“聚数据”平台整理了网上开放的免费科研数据集,以下是分类列表以及下载地址,供高校和科研机构免费下载和使用。以下内容转自https://blog.csdn.net/qq_32447301/article/details/79487335金融美国劳工部统计局官方发布数据上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票深证A股日线数据,1999...
详细介绍可以看seaborn官方API和example galler。1 set_style( ) set( )set_style( )是用来设置主题的,Seaborn有五个预设好的主题: darkgrid , whitegrid , dark , white ,和 ticks 默认: darkgriimport matplotlib.pyplot as plt impor...
方法一:这种方法需要引入glob模块glob模块是最简单的模块之一,内容非常少。用它可以查找符合特定规则的文件路径名。跟使用windows下的文件搜索差不多。查找文件只用到三个匹配符:”*”, “?”, “[]”。”*”匹配0个或多个字符;”?”匹配单个字符;”[]”匹配指定范围内的字符,如:[0-9]匹配数字。具体实现如下:import pandas as pdimport ...
将之前XGBoost的笔记整理在CSDN上。一、通用参数一、这些参数用来控制XGBoost的宏观功能。1、booster[默认gbtree] 选择每次迭代的模型,有两种选择: gbtree:基于树的模型 gbliner:线性模型2、silent[默认0] 当这个参数值为1时,静默模式开启,不会输出任何信息。 一般这个参数就保持默认的0,因为这样能帮我们更好地理解模型。3、nth...
1 矩对于随机变量X,X的K阶原点矩为X的K阶中心矩为期望实际上是随机变量X的1阶原点矩,方差实际上是随机变量X的2阶中心矩变异系数(Coefficient of Variation):标准差与均值(期望)的比值称为变异系数,记为C.V偏度Skewness(三阶)峰度Kurtosis(四阶)2 偏度与峰度 3 利用matplotlib模拟偏度和峰度...
相信关于混淆矩阵、ROC和AUC的问题一直困扰着大家,要想搞懂ROC和AUC,首先要明白混淆矩阵是什么。混淆矩阵混淆矩阵中有着Positive、Negative、True、False的概念,其意义如下:称预测类别为1的为Positive(阳性),预测类别为0的为Negative(阴性)。预测正确的为True(真),预测错误的为False(伪)。对上述概念进行组合,就产生了如下的混...
1 集成学习概述集成学习(Ensemble Learning)是一种能在各种的机器学习任务上提高准确率的强有力技术,其通过组合多个基分类器(base classifier)来完成学习任务。基分类器一般采用的是弱可学习(weakly learnable)分类器,通过集成学习,组合成一个强可学习(strongly learnable)分类器。所谓弱可学习,是指学习的正确率仅略优于随机猜测的多...







