书忆江南个人主页

@qq_33588730

书忆江南

2023-08-08 18:29:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Spark高级分析与机器学习笔记

一、高级分析和机器学习概览1. 高级分析是指各种旨在发现数据规律，或根据数据做出预测和推荐等核心问题的技术。机器学习最佳的模型结构要根据要执行的任务制定，最常见的任务包括：（1）监督学习，包括分类和回归，其目标是根据数据项的各种特征预测每个数据项的标签。（2）推荐系统，根据行为向用户推荐产品。（3）无监督学习，包括聚类，异常检测，以及主题建模，其目的是发现数据中的结构。（4）图...

一、各界面说明1.1、查看YARN页面的driver日志可以在右侧搜索框中填对应application号找到任务，然后点击对应的application号链接，如下图所示：这样会进入该application的信息界面，“FinalStatus”显示了该application的最后状态，点击下方的“logs”按钮也会进入到driver日志界面，如下图所示：对于driver日志而言，代码中的printl

#spark

Spark常见报错与问题解决方法

1.org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow原因：kryo序列化缓存空间不足。解决方法：增加参数，--confspark.kryoserializer.buffer.max=2047m。2.org.elasticsearch.hadoop.rest.EsHadoopNoN...

#spark

Linux容器化原理笔记

一、容器1. 从一台物理机虚拟化出很多虚拟机这种方式，一定程度上实现了资源创建的灵活性。但是同时会发现，虚拟化的方式还是非常复杂的， CPU、内存、网络、硬盘全部需要虚拟化，还有性能损失。那有没有一种更加灵活的方式，既可以隔离出一部分资源，专门用于某个进程，又不需要费劲周折的虚拟化这么多的硬件呢？毕竟最终只想跑一个程序，而不是要一整个Linux系统。在Linux操作系统中，有一项新的技术称...

#容器 #docker #kubernetes

Linux虚拟化原理笔记

一、虚拟机1. 操作系统上的程序分为两种，一种是用户态的程序例如Word、Excel等，一种是内核态的程序例如内核代码、驱动程序等。为了区分内核态和用户态，CPU专门设置四个特权等级0、1、2、3。在虚拟化技术出现以前，内核态运行在第0等级，用户态运行在第3等级，占了两头中间的还没用。如果用户态程序做事情，就切换到第3等级，一旦要申请使用更多的资源，就需要到内核态第0等级，内核才能在高权限访问..

#linux

算法（第四版）习题答案与Intellij IDEA算法环境配置

以下是本人上传到GitHub上的正文及习题的代码，部分代码有详细注释，部分答案参考了其他几位大神的答案并根据自己的理解加上了注释或有一点修改：https://github.com/hackeryang/Algorithms-Fourth-Edition-Exercises关于学习这本书的开发环境配置，首先需要去书本官网下载algs4.jar这个文件：https://algs4.cs.pri...

到底了