logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大数据】Ranger-2.3.0 安装

Apache Ranger来源于2013年成立于美国加利福尼亚的XA Secure公司,它是一个Hadoop安全相关的开源组件。在2014年,Hortonworks收购了XA Secure公司,将其贡献给了Apache软件基金会,目前是Apache的顶级开源项目。

文章图片
#mysql#数据库
【大数据Hadoop】Hadoop 3.x 新特性总览

从功能上来说,Hadoop3比Hadoop2有些功能得到了增强,具体增加了哪些,后面再讲。JDK:在Hadoop2时,可以使用JDK7,但是在Hadoop3中,最低版本要求是JDK8,所以低于JDK8的版本需要对JDK进行升级,方可安装使用Hadoop3EC技术:Erasure Encoding 简称EC,是Hadoop3给HDFS拓展的一种新特性,用来解决存储空间文件。EC技术既可以防止数据丢失

文章图片
#hadoop#大数据#java
【大数据Hadoop】Hadoop 3.x 新特性总览

从功能上来说,Hadoop3比Hadoop2有些功能得到了增强,具体增加了哪些,后面再讲。JDK:在Hadoop2时,可以使用JDK7,但是在Hadoop3中,最低版本要求是JDK8,所以低于JDK8的版本需要对JDK进行升级,方可安装使用Hadoop3EC技术:Erasure Encoding 简称EC,是Hadoop3给HDFS拓展的一种新特性,用来解决存储空间文件。EC技术既可以防止数据丢失

文章图片
#hadoop#大数据#java
【大数据】Hive 远程调试

Hive远程debug调试,跟踪源代码,学习源代码,学习hive

文章图片
#hive#hadoop#大数据
【机器学习】支持向量机(SVM)算法

机器学习-支持向量机(svm)

文章图片
#算法
【大数据SQL测试】tpch压测

TPCH性能压测,功能压测,sql基准测试,sparksql性能测试,数据生成工具,如果你之前生成过数据表,可以执行make clean先清除一下再执行以下命令。执行dbgen,生成数据表,大小为2G。根据自己需要设定参数。

#大数据#sql#数据库
【大数据】Apache Spark 3.3.0 正式发布,新特性详解

Apache Spark 3.3.0 从2021年07月03日正式开发,历时近一年,终于在2022年06月16日正式发布,在 Databricks Runtime 11.0 也同步发布。PySpark 的 PyPI 月下载量已经迅速增长到2100万次,Python 现在是最流行的 API 语言。与去年同期相比,PySpark 的月下载量翻了一番。此外,Maven 的月下载量超过2400万次。Spa

文章图片
#大数据#spark#分布式
【大数据Hadoop】macbookpro m1/m2 arm 编译hadoop-3.3.1

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop 在macbookpro m1/m2 arm架构上编译protobuf 失败的解决办法,hadoop-3.3.1版本的编译,部署

文章图片
#hadoop#大数据#分布式
【云原生】kubernetes离线安装

【代码】【云原生】kubernetes1.19.2离线安装部署

文章图片
#kubernetes#云原生#docker
    共 24 条
  • 1
  • 2
  • 3
  • 请选择