logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

评估回归模型的指标:MSE、RMSE、MAE、R2、偏差和方差

在回归任务(对连续值的预测)中,常见的评估指标(Metric)有:平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE),其中用得最为广泛的就是MAE和MSE。下面依次来.

#机器学习#逻辑回归#深度学习 +2
Python 数据类型:布尔类型和None

bool(也叫逻辑值)有True和False,用于表示真或假。True和False是预先定义的关键字,在内部,True和False是bool的实例,实际上仅仅是内置的整数类型int的子类。True和False的行为跟整数1和0是相同的。有些值是unknown的,用None来表示。一,布尔类型bool数据类型的值是:True和False,显示的是True和False,其行为跟整数1和0是相同...

#python#java#c++ +1
Bulk Insert:将文本数据(csv和txt)导入到数据库中

将文本数据导入到数据库中的方法有很多,将文本格式(csv和txt)导入到SQL Server中,bulk insert是最简单的实现方法1,bulk insert命令,经过简化如下BULK INSERT schema_name . table_nameFROM 'data_file'WITH(FIELDTERMINATOR = 'field_terminator',ROWT...

#数据库#mysql#java +2
动态数据掩码

动态数据掩码(Dynamic Data Masking,简称为DDM)能够防止把敏感数据暴露给未经授权的用户。DDM作用于数据表的字段上,在查询结果中隐藏敏感数据。启用DDM不会修改表中的数据,只是把查询结果对未经授权的用户屏蔽,使未授权用户看到的查询结果是被掩码的,例如,第二列是号码列,前7个数字被掩码,只暴露后三位数字:动态数据屏蔽在SQL Server 2016 (13.x)和A...

#数据库#java#mysql +2
Python 学习 第17篇:sqlalchemy 读写SQL Server数据库

在Python语言中,从SQL Server数据库读写数据,通常情况下,都是使用sqlalchemy 包和 pymssql 包的组合,这是因为大多数数据处理程序都需要用到DataFrame对象,它内置了从数据库中读和写数据的函数:read_sql()和to_sql(),这两个函数支持的连接类型是由sqlalchemy和pymssql构成的,因此,掌握这两个包对于查询SQL Server数据库十分.

#数据库#mysql#java +2
NumPy 学习 第一篇:ndarray 的创建和形状操纵

NumPy是Python中用于科学计算的基础软件包,提供了多维数据组对象,用于对数据进行快速的计算,NumPy包中最核心的类型是ndarray,封装了python原生的相同数据类型的n维数组,定义了一个执行矢量算术运算的n维数组,无需编写循环结构,就能对整个数组进行批量运算。通常情况下,导入NumPy,设置别名为np。import numpy as npPython原生数组是Arr...

#python#java#numpy +2
翻译:miceforest:使用Python中的随机森林进行快速插补

原文:miceforest: Fast Imputation with Random Forests in Pythonmiceforest 包实现随机森林的链式方程式(MICE)多重插补,具有快速、内存利用率高的特征,无需太多设置即可插入缺失的分类和数值数据,并且具有一系列可用的诊断图。一,miceforest包的组成miceforest 有4个主要的class:KernelDataSet:内核

#机器学习
数据仓库的价值

数据仓库建成之后,如何从投资中获得最大的收益?答案是分析数据。分析数据是指从数据仓库中观察和分析数据,以获得有价值的信息,即insight。最有前景的数据分析是面向未来的数据分析,换种说法,就是利用数据仓库中的历史数据来预测。大多数商业智能环境中的分析是面向过去的,通过分析企业在经营过程产生的历史数据,来对企业的运营情况进行监控。通过报表工具,实现数据分析结果的可视化,比如,分析客户的消费行为,使

#数据仓库
数据挖掘 第五篇:分类(kNN)

K最近邻(kNN,k-NearestNeighbor)算法是一种监督式的分类方法,但是,它并不存在单独的训练过程,在分类方法中属于惰性学习法,也就是说,当给定一个训练数据集时,惰性学习法简单地存储或稍加处理,并一直等待,直到给定一个检验数据集时,才开始构造模型,以便根据已存储的训练数据集的相似性对检验数据集进行分类。惰性学习法在提供训练数据集时,只做少量的计算,而在进行分类或数值预测时做更多的计.

#算法#机器学习#python +2
到底了