logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘入门项目二手交易车价格预测之特征工程

特征工程的主要目的还是在于将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。比如,异常值处理是为了去除噪声,填补缺失值可以加入先验知识等特征构造也属于特征工程的一部分,其目的是为了增强数据的表达。

文章图片
#数据挖掘#人工智能
数据挖掘入门项目二手交易车价格预测之建模调参

上述我们主要通过log转换正则化模型选择参数微调等方法来提高预测的精度最后附上一些学习链接供大家参考:线性回归模型:https://zhuanlan.zhihu.com/p/49480391决策树模型:https://zhuanlan.zhihu.com/p/65304798GBDT模型:https://zhuanlan.zhihu.com/p/45145899XGBoost模型:https://

文章图片
#数据挖掘#人工智能
Oracle入门之函数返回游标

在Oracle中,函数的返回值可以是游标。游标变量的类型是sys_refcursor。定义函数时,返回值类型是sys_refcursor,在函数中声明一个sys_refcursor的变量,返回该变量。

#oracle#数据库
已经创建好的python虚拟环境修改版本最简单解决办法

今天在用原来的python环境运行新的代码的时候,发现版本有点老,不支持一些新的包,重新创建一个虚拟环境之前安装的包就浪费了,而且重新安装这些包又要浪费时间,怎么用最方便最快捷的方法来升级我的python版本呢?

文章图片
#python
django对数据库中的表进行重新生成

关于详细的数据表生成见博文:https://blog.csdn.net/David_house/article/details/131385460?

文章图片
#数据库#django#python
git克隆仓库的时候遇到没有权限或者没有正确权限的解决办法

git克隆仓库的时候遇到没有权限或者没有正确权限的解决办法。

文章图片
#git
数据挖掘入门项目二手交易车价格预测之数据分析

数据探索有利于我们发现数据的一些特性,数据之间的关联性,对于后续的特征构建是很有帮助的。对于数据的初步分析(直接查看数据,或.sum(), .mean(),.descirbe()等统计函数)可以从:样本数量,训练集数量,是否有时间特征,是否是时许问题,特征所表示的含义(非匿名特征),特征类型(字符类似,int,float,time),特征的缺失情况(注意缺失的在数据中的表现形式,有些是空的有些是”

文章图片
#数据挖掘#数据分析#人工智能
报错:ssh: Could not resolve hostname node05: Name or service not known

报错:ssh: Could not resolve hostname node05: Name or service not known我这里报错是因为我在搭建hadoop集群的时候没有对我的虚拟机进行免密配置,导致我在分发文件的时候报错。具体错误如图:

#hadoop
把本地文件上传到HDFS上操作步骤

实验条件:我在虚拟机上创建了三台节点,部署了hadoop,把笔记本上的数据上传到hdfs中。因为条件有限,我这里以虚拟机为例。

文章图片
#hdfs#hadoop#大数据
hadoop环境之java jdk的配置

java jdk的配置在搭建hadoop环境之前,我们要先配置java的jdk环境。1.首先安装rz命令,rz命令可以从本地上传文件到虚拟机中[root@node04 ~]# yum -y install lrzsz当然,大家也可以使用别的方法将安装包传进虚拟机中2.创建一个目录存放jdk安装包还有后面一系列可能要上传的安装包,然后进入到该目录下[root@node04 ~]# cd /opt/S

#hadoop
    共 27 条
  • 1
  • 2
  • 3
  • 请选择