悦光阴个人主页

@upluck

悦光阴

2022-07-08 16:51:42 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

评估回归模型的指标：MSE、RMSE、MAE、R2、偏差和方差

在回归任务(对连续值的预测)中，常见的评估指标(Metric)有：平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)，其中用得最为广泛的就是MAE和MSE。下面依次来.

#机器学习 #逻辑回归 #深度学习 +2

Python 数据类型：布尔类型和None

bool(也叫逻辑值)有True和False，用于表示真或假。True和False是预先定义的关键字，在内部，True和False是bool的实例，实际上仅仅是内置的整数类型int的子类。True和False的行为跟整数1和0是相同的。有些值是unknown的，用None来表示。一，布尔类型bool数据类型的值是：True和False，显示的是True和False，其行为跟整数1和0是相同...

#python #java #c++ +1

Bulk Insert：将文本数据（csv和txt）导入到数据库中

将文本数据导入到数据库中的方法有很多，将文本格式(csv和txt)导入到SQL Server中，bulk insert是最简单的实现方法1，bulk insert命令，经过简化如下BULK INSERT schema_name . table_nameFROM 'data_file'WITH(FIELDTERMINATOR = 'field_terminator',ROWT...

#数据库 #mysql #java +2

动态数据掩码

动态数据掩码(Dynamic Data Masking，简称为DDM)能够防止把敏感数据暴露给未经授权的用户。DDM作用于数据表的字段上，在查询结果中隐藏敏感数据。启用DDM不会修改表中的数据，只是把查询结果对未经授权的用户屏蔽，使未授权用户看到的查询结果是被掩码的，例如，第二列是号码列，前7个数字被掩码，只暴露后三位数字：动态数据屏蔽在SQL Server 2016 (13.x)和A...

#数据库 #java #mysql +2

Python 学习第17篇：sqlalchemy 读写SQL Server数据库

在Python语言中，从SQL Server数据库读写数据，通常情况下，都是使用sqlalchemy 包和 pymssql 包的组合，这是因为大多数数据处理程序都需要用到DataFrame对象，它内置了从数据库中读和写数据的函数：read_sql()和to_sql()，这两个函数支持的连接类型是由sqlalchemy和pymssql构成的，因此，掌握这两个包对于查询SQL Server数据库十分.

#数据库 #mysql #java +2

NumPy 学习第一篇：ndarray 的创建和形状操纵

NumPy是Python中用于科学计算的基础软件包，提供了多维数据组对象，用于对数据进行快速的计算，NumPy包中最核心的类型是ndarray，封装了python原生的相同数据类型的n维数组，定义了一个执行矢量算术运算的n维数组，无需编写循环结构，就能对整个数组进行批量运算。通常情况下，导入NumPy，设置别名为np。import numpy as npPython原生数组是Arr...

#python #java #numpy +2

翻译：miceforest：使用Python中的随机森林进行快速插补

原文：miceforest: Fast Imputation with Random Forests in Pythonmiceforest 包实现随机森林的链式方程式（MICE）多重插补，具有快速、内存利用率高的特征，无需太多设置即可插入缺失的分类和数值数据，并且具有一系列可用的诊断图。一，miceforest包的组成miceforest 有4个主要的class：KernelDataSet：内核

#机器学习

数据仓库的价值

数据仓库建成之后，如何从投资中获得最大的收益？答案是分析数据。分析数据是指从数据仓库中观察和分析数据，以获得有价值的信息，即insight。最有前景的数据分析是面向未来的数据分析，换种说法，就是利用数据仓库中的历史数据来预测。大多数商业智能环境中的分析是面向过去的，通过分析企业在经营过程产生的历史数据，来对企业的运营情况进行监控。通过报表工具，实现数据分析结果的可视化，比如，分析客户的消费行为，使

#数据仓库

数据挖掘第五篇：分类（kNN）

K最近邻(kNN，k-NearestNeighbor)算法是一种监督式的分类方法，但是，它并不存在单独的训练过程，在分类方法中属于惰性学习法，也就是说，当给定一个训练数据集时，惰性学习法简单地存储或稍加处理，并一直等待，直到给定一个检验数据集时，才开始构造模型，以便根据已存储的训练数据集的相似性对检验数据集进行分类。惰性学习法在提供训练数据集时，只做少量的计算，而在进行分类或数值预测时做更多的计.

#算法 #机器学习 #python +2

到底了