浮光之海~ 个人主页

@m0_62224692

浮光之海~

2023-09-16 11:23:34 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

hdfs文件权限

hadoop fs -chmod -R 777 /sparkdata

#hdfs #hadoop #大数据

hadoop上传文件

hadoop fs -put /Hadoop/word.txt /sparkdata

#hadoop

随机森林模型

如下图所示，随机森林模型会在原始数据集中随机抽样，构成n个不同的样本数据集，然后根据这些数据集搭建n个不同的决策树模型，最后根据这些决策树模型的平均值（针对回归模型）或者投票（针对分类模型）情况来获取最终结果。举例来说，有1000个原始数据，有放回的抽取1000次，构成一组新的数据（因为是有放回抽取，有些数据可能被选中多次，有些数据可能不被选上），作为某一个决策树的数据来进行模型的训练。随机森林是

#随机森林 #算法 #机器学习

基于CentOS虚拟机的Spark分布式开发环境搭建

⦁/Spark/spark-x.x.x-bin-hadoopx.x/conf/spark-env.sh（原来的文件名是spark-env.sh.template，修改为spark-env.sh）⦁输入命令，ssh-keygen -t rsa，生成key，都不输入密码，一直回车，/root就会生成.ssh文件夹，每台服务器都要设置。⦁把前面下载的“hadoop-x.x.x.tar.gz”文件，通过终

#sql #database #hadoop +2

到底了