logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【特征】PSI的计算

PSI:检验变量的稳定性,当一个变量的psi值大于0.0001时,变量不稳定。一个变量,将它的取值按照分位数来分组一下,每一组中测试模型的客户数占比减去训练模型中的客户数占比再乘以这两者相除的对数,就是这一组的稳定性系数psi,然后变量的psi系数就是把这个变量的所有组的psi相加总起来。计算某个变量的PSI,上面这段话中测试模型和训练模型替换成两个月份即可。例如,下表是某个变量,以201....

#金融
【编程语言】Julia0.6.4 in jupyter notebook windows系统 环境配置

以下第1、2部分可以参考julia简易教程——安装Julia+jupyter notebooks1. 安装Anaconda这里主要是为了安装jupyter notebook。2. 安装Julia这里Julia用了0.6.4的版本(1.4.2版本当时可能环境没配置好,总在报错,稍后再研究下这个版本的)之后打开Julia,运行以下语句却出现了报错#Juliaimport PkgPkg.add("IJu

Keras_深度学习_MNIST数据集手写数字识别之各种调参

注:这里的代码是听台大李宏毅老师的ML课程敲的相应代码。先各种importimport numpy as npnp.random.seed(1337)# https://keras.io/!pip install -q kerasimport kerasfrom keras.models import Sequentialfrom keras.layers.co

#深度学习
Keras_深度学习_MNIST数据集手写数字识别之各种调参

注:这里的代码是听台大李宏毅老师的ML课程敲的相应代码。先各种importimport numpy as npnp.random.seed(1337)# https://keras.io/!pip install -q kerasimport kerasfrom keras.models import Sequentialfrom keras.layers.co

#深度学习
【Hive】计算分位数

hive中有两个函数可以用来计算分位数:percentile和percentile_approx具体使用方如下:(1)percentile:percentile(col, p)col是要计算的列(值必须为int类型),p的取值为0-1,若为0.5,那么就是2分位数,即中位数。(2)percentile_approx:percentile_approx(col, p)。列为数值类型都可以。perce

文章图片
#hive#hadoop#数据仓库
pandas日期列读取成日期格式

read_cav的时候加一个参数:parse_dates = ['date'],就会把date这一列自动转化为日期格式,例如:import pandas as pddata = pd.read_csv('test.csv',parse_dates = ['date'])如果原来读取进来日期格式为 “2018-05-09 10:43:52”, 想把该日期变为 “20180...

【Pytorch】OSError: libc10_cuda.so: cannot open shared object file: No such file or directory

摘自https://githubhot.com/repo/rusty1s/pytorch_geometric/issues/3904https://githubhot.com/repo/rusty1s/pytorch_geometric/issues/3904It looks like you have installed PyTorch with CUDA support (there exis

#python
【Word】首行调整段前距无效

很小的问题,如题,如图找到了大神给的正确解法:点击打开链接

【Python】「argparse基本用法」及「jupyter中使用 args = parser.parse_args()并传参」

【argparse基本用法】及【jupyter中使用 args = parser.parse_args()并传参】

文章图片
#python
Hive之Select Transform语法()

参考文章:阿里云 Select Transform语法hive transform python主要解释:Select Transform功能允许指定启动一个子进程,将输入数据按照一定的格式通过stdin输入子进程,并且通过parse子进程的stdout输出来获取输出数据。能在不编写UDF的前提下实现MaxCompute SQL不具备的功能。最近的脚本涉及到的用法:...

到底了