logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python连接Hive数据库

import pyhivefrom pyhive import hiveimport pandas as pdimport key_oneclass LinkHive(object):def __init__(self,host,port,username,password,database):self.host = hostself.port = portself.username = user

#hive#数据库
RFM用户分层模型|原理+Python全流程实现

RFM 模型在数据分析中经常会进行用户分层,本文我们来了解一下常见的用户分层模型RFM。RFM概念RFM是由R(Recency)、F (Frequency)、 M(Monetary) 三个维度构成的,其具体含义如下:R:最近一次消费时间间隔F:消费频率M:消费金额这里对于这三个维度的概念简单的做一个说明:R:当前日期为3.25日,上一次消费日期3月20日,消费时间间隔为5天。F:一年内去某商场消费

文章图片
#python#数据分析
Sklearn|报错<Expected 2D array, got 1D array instead:...>的3种解决办法

当我们使用sklearn进行fit或者predict等操作的时候,经常会遇到Expected 2D array, got 1D array instead一类的报错,其根本原因是因为最新的sklearn必须要传入一个二维矩阵所导致的,解决办法有如下三种。一、numpy将行转成列一行数据是一维数据,我们转成一列数据自然就是二维数据了。import numpy as npx = [1, 2, 3]x

#sklearn#python#机器学习
MySQL|基础操作+8大查询方式汇总

MySQL中可以创建多个数据库用于存储不同场景的表结构,学习MySQL之前,我们要先理清如下的关系:数据库 --> 数据表 --> 字段抛开数据库存储上限去考虑,每个数据库中可以包含无数个数据表,而每个数据表又可以包含无数个字段,因此我们的学习也应该从创建数据库开始。use 数据库名;

文章图片
#数据分析#mysql
Python使用ffmpeg完美解决方案(避坑必看)

近期有个需要进行音频转码的小任务需要用到ffmpeg,安装和使用的过程中遇到了很多问题没有办法解决,从网上找了各种教程也是一言难近,本文二哥来梳理一下从0到1在Mac上使用ffmpeg。一、在系统中安装ffmpeg第一步需要在系统中安装ffmpeg,很多人都给出了使用brew命令进行下载的方案,在此说一下,多数人brew后都需要等n分钟,最后以报错告终,这种外部网站不稳定,因此强烈不推荐此方法。稳

#macos#音视频#python
Python调用Face++API处理图片并保存到本地

注册申请无需多说代码如下    具体解释注释在代码中,如有疑问欢迎留言讨论。import requestsfrom json import JSONDecoderimport base64import time#下面是进行图像分割的APIhttp_url = "https://api-cn.faceplusplus.com/humanbodypp...

详细整理几种常见的损失函数|机器学习

机器学习|常见的损失函数公众号:数据山谷在学习过程中我们经常会接触到损失函数、代价函数、目标函数三个词语,本文让我们来总结一下机器学习中常见的损失函数和代价函数。概念首先让我们来了解一下三种损失函数的概念。损失函数(Loss Function )是定义在单个样本上的,算的是一个样本的误差。代价函数(Cost Function )是定义在整个训练集上的,是所有样本误差的平均,也就是损失函数的平均。目

#机器学习#算法
瞎聊机器学习——多分类的精确率和召回率

我们常用的精确率和召回率通常都用于二分类的问题上,那么在多分类上应该怎样去使用这些评价指标呢?多分类的精确率和召回率既然精确率和召回率的概念以及计算公式都指向二分类问题,那么我们不妨将多分类问题转换为二分类问题来做。先来看一下精确率和召回率的概念:精确率是指分类正确的正样本个数占分类器判定为正样本的个数的比例。召回率是指分类正确的正样本占真实正样本的比例。根据概念我们知道,在...

十大常用机器学习算法总结(持续完善)

前言之前二哥连载了各类常用的机器学习算法的原理与具体推倒过程,本文我们对常用的十大机器学习算法进行总结。、、

文章图片
#算法#python#机器学习 +1
    共 15 条
  • 1
  • 2
  • 请选择