logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

0693-6.2.0-如何将Hive数据导入HBase

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f1 文档编写目的在一些业务场景中需要将Hive的数据导入到HBase中,通过HBase服务为线上业务提供服务能力。本篇文章Fayson主要通过在Hive上创建整合HBase表的方式来实现Hive数据导入到HBa...

#hive#hbase
0675-6.2.0-什么是HDFS分层存储

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f1 概述CDH支持Hadoop分布式文件系统HDFS中的各种存储类型。早期的CDH只支持一种存储类型。现在,您可以为DataNode数据目录指定不同的存储类型,这样可以根据数据使用频率优化数据使用并降低成本。例...

#hdfs
0377-如何在Redhat7.4安装CDH6.0

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f,或者扫描文末二维码。1.文档编写目的Cloudera在前天8月30日,对外宣布正式发布Cloudera Enterprise 6,相关介绍可以参考Fayson昨天的文章《Cloudera Enterprise...

#cloudera
0672-5.16.1-CDSW中Run Experiments异常分析

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f1 CDSW Experiments简介从CDSW (Cloudera Data Science Workbench) 1.4开始,CDSW中新增了一个Experiments 功能,它允许数据科学家运行批处理实...

从开发到生产上线,如何确定集群大小?

翻译|毛家琦校对|秦江杰在 Flink 社区中,最常被问到的问题之一是:在从开发到生产上线的过程中如何确定集群的大小。这个问题的标准答案显然是“视情况而定”,但这并非一个有用的答案。本文概述了一系列的相关问题,通过回答这些问题,或许你能得出一些数字作为指导和参考。计算并建立一个基线第一步是仔细考虑应用程序的运维指标,以达到所需资源的基线。需要考虑的关键指标是:每秒记录数和每条记录的大...

0632-6.2-通过Hive生成的Snappy表Impala无法访问异常分析

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f1 问题重现测试环境:1.CDH6.22.集群已开启Kerberos3.Redhat7.41.已经准备好一个Parquet文件的表。hive> show create table hive_...

0462-如何在Hue中创建Shell Action工作流续

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f,或者扫描文末二维码。感谢群友Beetes提出的问题。1.文档编写目的Fayson在前面的文章《Hue中使用Oozie创建Shell工作流在脚本中切换不同用户》,里面介绍了Shell Action的创建,在文...

0462-Hadoop和大数据要完蛋了吗?

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f,或者扫描文末二维码。作者:Alex Robbio,Belatrix Software的总裁兼联合创始人,去年在阿根廷获得了年度EY企业家奖几个星期以前,Hadoop时代的两大巨头Cloudera和Hor...

#大数据#AI#人工智能
0673-6.2.0-通过Nginx获取CDSW的登录信息(续)

Fayson的github: https://github.com/fayson/cdhproject推荐关注微信公众号:“Hadoop实操”,ID:gh_c4c535955d0f1 文档编写目的在上一篇文章《6.2.0-通过Nginx获取CDSW的登录信息》中,通过Nginx的配置捕获了用户登陆相关的一些信息,比如登陆成功或失败、登陆时间、用户名等等。在收集了用户的登陆信息后,目前还想...

#nginx
0435-如何在CDH6.0中使用纠删码

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。Fayson的github:https://github.com/fayson/cdhproject提示:代码块部分可以左右滑动查看噢1.文档编写目的Fayson在前面的文章中介绍过《什么是HDFS的纠删码》,当时详细介绍了什么是纠删码,纠删码的实现原理,以及一些Benchmark的结果比较。...

    共 13 条
  • 1
  • 2
  • 请选择