
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
机器学习领域的一个特点就是日新月异,在数据竞赛中,一件趁手的工具对比赛结果有重要影响。boosting是一种将弱分类器组合成强分类器的方法,它包含多种算法,如GDBT、AdaBoost、XGBoost等等。如果你参加过Kaggle之类的数据竞赛,你可能听说过XGBoost在数据江湖上的领导地位,也可能好奇过LGBM的快速崛起。但是,你听说过俄罗斯最大搜索引擎Yandex开发的CatBoost吗?.
相信大家在学习GroupBy,或者数据透视表时,都有可能会碰到类似下面的一行代码:import seaborn as snsplanets = sns.load_dataset('planets')然后就可以发现planets已经存储了数据了,那么这些数据到底是从哪里来的呢?我们查看一下load_dataset的docstring:In [54]: sns.load_data...
Python图像处理库PIL的ImageFilter模块介绍ImageFilter模块提供了滤波器相关定义;这些滤波器主要用于Image类的filter()方法。一、ImageFilter模块所支持的滤波器当前的PIL版本中ImageFilter模块支持十种滤波器:1、 BLURImageFilter.BLUR为模糊滤波,处理之后的图像会整体变得模糊。例子:>&...
相信大家在学习GroupBy,或者数据透视表时,都有可能会碰到类似下面的一行代码:import seaborn as snsplanets = sns.load_dataset('planets')然后就可以发现planets已经存储了数据了,那么这些数据到底是从哪里来的呢?我们查看一下load_dataset的docstring:In [54]: sns.load_data...
跟numpy.random.seed()一样刚开始理解都是很头疼的存在,但其实他们的用法几乎一样(如果有人对seed()有疑问的话可以看我的另一篇讲解:【数据处理】Numpy.random.seed()的用法 ):numpy.random.RandomState()是一个伪随机数生成器。那么伪随机数是什么呢?伪随机数是用确定性的算法计算出来的似来自[0,1]均匀分布的随机数序列。并不真正的...
刚开始看到numpy.random.seed(0)这个用法看不太懂,尤其是seed()括号里的数字总是不同时,更是懵逼。类似的取随机数的还有这个:【数据处理】numpy.random.RandomState的用法其实,设置seed()里的数字就相当于设置了一个盛有随机数的“聚宝盆”,一个数字代表一个“聚宝盆”,当我们在seed()的括号里设置相同的seed,“聚宝盆”就是一样...
目录十大排序算法(Python实现)一. 算法介绍及相关概念解读算法分类相关概念1. 交换排序1.1 冒泡排序(Bubble Sort)1.2 快速排序(Quick Sort)2. 插入排序2.1 简单插入排序(Insert Sort)2.2 希尔排序(Shell Sort)3.选择排序3.1 简单选择排序(Select Sort)3.2 堆排序...







