韩立 • 个人主页

@qq_44386182

韩立 •

2023-11-10 21:46:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

python数据分析之药品数据分析

输入timeColSer销售时间这一列，Series数据类型，例‘2018-01-01星期五’输出分割后的时间，返回Series数据类型，例‘2018-01-01’统计月均消费次数（同一天一个人的所有消费算作一次消费）转换日期过程中不符合日期格式的数值会被转换为空值。其中，商品编码就是商品名称这两列数据重复。将'销售数量'这一列小于0的数据排除掉。以下可知购药时间和社保卡号存在缺失值。定义函数分割

#python #数据分析 #numpy

量化交易策略之股票数据分析（Python）

4：假如从2010 1.1 开始，每月第一个交易日买入一手股票，每年最后一个交易日卖出所有股票，到今天为止，我们受益如何？4：假如从2010 1.1 开始，每月第一个交易日买入一手股票，每年最后一个交易日卖出所有股票，到今天为止，我们受益如何？其次，读取k线数据，并保存下来，然后重新读取并完成目标2。3：输出该股票所有开盘比前日收盘跌幅超过2%的日期。3：输出该股票所有开盘比前日收盘跌幅超

#python #数据分析 #机器学习

机器学习之验证方式理解

简单交叉验证方法：将原始数据集随机划分成训练集和验证集两部分。比如，将样本按照70%~30%的比例分成两部分，70%的样本用于训练模型；30%的样本用于模型验证。缺点：（1）数据都只被所用了一次，没有被充分利用（2）在验证集上计算出来的最后的评估指标与原始分组有很大关系。代码k折交叉验证为了解决简单交叉验证的不足，提出k-fold交叉验证。1、首先，将全部样本训练集划分成k个大小相等的样本子集；

#大数据

量化交易策略之股票数据分析（Python）

#python #数据分析 #机器学习

机器学习之验证曲线绘制-调参可视化-sklearn

需要注意的是如果我们使用验证分数来优化超参数，那么该验证分数是有偏差的，它无法再代表模型的泛化能力，我们就需要使用其他测试集来重新评估模型的泛化能力。验证曲线和学习曲线的区别是，横轴为某个超参数的一系列值，由此来看不同参数设置下模型的准确率(评价标准)，而不是不同训练集大小下的准确率。从验证曲线上可以看到随着超参数设置的改变，模型可能从欠拟合到合适再到过拟合的过程，进而选择一个合适的设置，来提高模

#机器学习 #sklearn #python

线性判别分析（Linear Discriminant Analysis，简称LDA）是一种经典的监督学习的数据降维方法，也叫做Fisher线性判别（Fisher Linear Discriminant，FLD），是模式识别的经典算法，它是在1996年由Belhumeur引入模式识别和人工智能领域的。LDA的主要思想是将一个高维空间中的数据投影到一个较低维的空间中，且投影后要保证各个类别的类内方差

#大数据

LDA判别分析和PCA主成分分析之数据降维

原理：线性判别分析（Linear Discriminant Analysis，简称LDA）是一种经典的监督学习的数据降维方法，也叫做Fisher线性判别（Fisher Linear Discriminant，FLD），是模式识别的经典算法，它是在1996年由Belhumeur引入模式识别和人工智能领域的。LDA的主要思想是将一个高维空间中的数据投影到一个较低维的空间中，且投影后要保证各个类别的类

#java #servlet #服务器

到底了