北山璎珞个人主页

@beishanyingluo

北山璎珞

2023-04-06 15:30:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Spark优点、组件及与hadoop的异同

一 Spark是什么Apache Spark 是一个快速的, 多用途的集群计算系统, 相对于 Hadoop MapReduce 将中间结果保存在磁盘中, Spark 使用了内存保存中间结果, 能在数据尚未写入硬盘时在内存中进行运算.Spark 只是一个计算框架, 不像 Hadoop 一样包含了分布式文件系统和完备的调度系统, 如果要使用 Spark, 需要搭载其它的文件系统和更成熟的调度系统二为

机器学习-特征工程

1、什么是特征工程1.1 特征工程是使用专业背景知识和技巧处理数据，使得特征能在机器学习算法上发挥更好的作用的过程。意义：会直接影响机器学习的效果数据集构成：特征值+目标值1.2 特征工程包含内容特征抽取特征预处理特征降维1.3 特征工程所需工具1） Scikit-learn对于特征的处理提供了强大的接口① Python语言的机器学习工具② Scikit-learn包...

机器学习 - 特征选择及降维

一特征选择1.1 定义数据中包含冗余或无关变量（或称特征、属性、指标等），旨在从原有特征中找出主要特征1.2特征选择的方法1）Filter(过滤式)主要探究特征本身特点、特征与特征和目标值之间关联方差选择法：低方差特征过滤相关系数2） Embedded (嵌入式)算法自动选择特征（特征与目标值之间的关联）决策树:信息熵、信息增益正则化：L1、L2深度学习：卷积等1...

Git的Ubuntu安装及使用（详细图文)

一查看是否安装了git 及安装在终端执行：git没有，进行git安装：sudo apt-get install git执行中可能有无错误，提示：E: Failed to eftch http://archives.........E: Unable to fetch http.....这个缺少某些依赖，进行更新操作即可，执行下面：sudo apt-get update再次执行git的安装命令，

#git

Spark 集群搭建（完整）

1. Spark 集群结构名词解释Driver该进程调用 Spark 程序的 main 方法, 并且启动 SparkContextCluster Manager该进程负责和外部集群工具打交道, 申请或释放集群资源Worker该进程是一个守护进程, 负责启动和管理 ExecutorExecutor该进程是一个JVM虚拟机, 负责运行 Spark Task运行一个 Spark 程序大致经历如下几个步骤

Python3爬取UN(联合国数据) api调用

# -*- coding=UTF-8 -*-import timeimport requestsimport reimport osfrom bs4 import BeautifulSoupfrom requests.exceptions import ConnectionError, ReadTimeoutimport csvimport jsonimport MySQLdb...

虚拟机-挂载磁盘

第一步：虚拟机关机新增磁盘在VMware当中新增一块磁盘第二步：开机之后进行磁盘挂载df -lhfdisk -l开始分区fdisk /dev/sdb这个命令执行后依次输 np1回车回车wfdisk -l格式化我们的分区mkfs -t ext4 -c /dev/sdb1格式化我们的分区mkdir /data02将我们的分区...

Spark 集群搭建（完整）

附资源安装：jdk-8u221-linux-x64.tar.gz / jdk-8u141-linux-x64.tar.gz

Oracle的官方JDK下载需要注册，且会出现下载到最后一点就限速的情况，这里放一下已经下载好的JDK连接：版本是jdk-8u221-linux-x64.tar.gz链接：https://pan.baidu.com/s/1GZnUwB3nraObgperKlmBCg提取码：17xx1.原有虚拟机jdk的卸载：一般Vmware虚拟机安装后，会有自带的jdk- openjdk查看命令：r...

#虚拟机 #大数据

Vmware虚拟机克隆后MAC地址IP地址修改并实现上网

Vmware虚拟机复制克克隆后MAC地址IP地址修改：步骤1：步骤2：更改mac地址：vim /etc/udev/rules.d/70-persistent-net.rulesname修改为 eth0 , 这里的mac地址，就是图一生成，如果还有其他配置，删除即可。步骤3：更改ip地址vim /etc/sysconfig/network-scripts/ifcfg-eth0...

#大数据 #虚拟机

共 13 条

请选择