
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
ROC曲线什么是ROC曲线?ROC曲线经常作为评估二分类的重要指标,其起源于军事领域,全称叫做receiver operating characteristic curve。ROC曲线是二维平面内的曲线,其横坐标为假阳性率(FPR),纵坐标为真阳性率(TPR)他们的计算方法如下:上式中:P:真实的正样本的数量N:真实的负样本的数量TP:P个正样本中被分类器预测为...
如何进行用户分群?分群后的策略如何进行?
特征选择为什么要进行特征选择我们在现实任务中经常会遇到维数灾难的问题,这是由于属性过多而造成的,若能从中选择出重要的特征,使得后续学习过程仅需在一部分特征上构建模型,则维数灾难问题会大为减轻。去除不相关特征往往会降低学习任务的难度,我们把复杂的问题变得简单化,往往也能使得效率变高,结果变的更准确。过滤式(Filter)过滤式是过滤式的方法先对数据集进行特征选择,然后再训练学习器,特征选择过程与后续
XGBoost和GBDT一样,XGBoost也是一种基于CART树的Boosting算法,让我们来看一下如何通俗的去理解XGBoost。先简单的回想一下,在我们之前提到过的GBDT中是怎样用很多棵树去做预测的?很简单,我们给了每棵树不同的训练数据,得到多种不同的结果,最终我们把这些结果相加作为最终的预测值就可以了。XGBoost的定义举一个简单的例子,我们要预测一家人对电子游戏的喜好程度,考虑到年
递归1. 递归递归是数据结构中也是我们平时写代码的时候非常常用的一种思想,通过递归可以将问题不断地分成更小的子问题,直到子问题能够用普通的方法解决,通常情况下,递归会使用一个不停调用自己的函数来实现。有很多人会将循环和递归放在一起做比较,下面通过一个小案例来看一下递归和循环的差别。举个例子:计算[1,2,3,4,5]的加和。使用循环count = 0numList = [1, 2, 3, 4
选择排序选择排序的思想选择排序的思想比较直观:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素都排序完毕。图解选择排序选择排序的性质最优时间复杂度:O(n2)O(n^2)O(n2)最坏时间复杂度:O(n2)O(n^2)O(n2)稳定性:不稳定(考虑升序每次选择最大的情况)对考虑升序
????大家好,欢迎来到二哥的一亩三分地。最近又到了秋招的季节,很多小伙伴们纷纷反映在面试Python的时候顺着面试官的坑就跳下去了,为了避免大家频繁踩坑,二哥准备开放专栏《Python面试100层》(一共1000道题),每篇10道精选面试题解读,希望小伙伴们能够跟上我的脚步一层一层的闯下去!❤️点击关注不迷路!❤️题目一对于Python中的表达式{1,2,3,4,5}-{3,4,5,6,7}的结

import pyhivefrom pyhive import hiveimport pandas as pdimport key_oneclass LinkHive(object):def __init__(self,host,port,username,password,database):self.host = hostself.port = portself.username = user
RFM 模型在数据分析中经常会进行用户分层,本文我们来了解一下常见的用户分层模型RFM。RFM概念RFM是由R(Recency)、F (Frequency)、 M(Monetary) 三个维度构成的,其具体含义如下:R:最近一次消费时间间隔F:消费频率M:消费金额这里对于这三个维度的概念简单的做一个说明:R:当前日期为3.25日,上一次消费日期3月20日,消费时间间隔为5天。F:一年内去某商场消费

近期有个需要进行音频转码的小任务需要用到ffmpeg,安装和使用的过程中遇到了很多问题没有办法解决,从网上找了各种教程也是一言难近,本文二哥来梳理一下从0到1在Mac上使用ffmpeg。一、在系统中安装ffmpeg第一步需要在系统中安装ffmpeg,很多人都给出了使用brew命令进行下载的方案,在此说一下,多数人brew后都需要等n分钟,最后以报错告终,这种外部网站不稳定,因此强烈不推荐此方法。稳