攻城狮Kevin 个人主页

@wx1528159409

攻城狮Kevin

2022-09-29 18:49:45 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Hive的概念、原理及其与Hadoop和数据库关系（图文讲解）

目录一、Hive到底是什么1. 如何理解Hive2. Hive中SQL-MapReduce原理图解3. 为什么说Hive是基于Hadoop的呢？二、Hive的优缺点1. 优点2. 缺点三、Hive的架构原理1. 两种客户端2. 四种驱动Driver3. 元数据库Meta store四、Hive和数据库的区别（1）数据存储位置不同（2）数据更新...

Hive表drop删除表后恢复表的分区数据

如果HDFS配置好回收站的话，drop删除表后可以通过命令恢复表数据，例如回收站HDFS路径如下：/user/hdp_teu_dpd/.Trash/Current/表的HDFS路径如下：/home/hdp_teu_dpd/warehouse/wbdb.db/dw_smart_merge_idmapping/当drop tabledw_smart_merge_idmappi...

#hive

通过Spark任务将数据写入ES报错——ES节点ip错误

报错如下org.elasticsearch.hadoop.rest.EsHadoopNoNodesLeftException: Connection error (check network and/or proxy settings)- all nodes failed; tried [[10.162.7.17:9219, 10.162.7.18:9219, 10.162.7.16:921...

Web中MVC设计理念 & 经典三层架构 & 五大主流框架

一、Web的MVC设计理念和MVC框架：之前在Web篇04中已经详述了Servlet、TomCat、JSP和Web.xml之间的联系；（1）浏览器发送请求到收到响应，简要的过程如下：浏览器发送请求后，由Web.xml中规定的协议，进入TomCat中特定的Servlet，服务器先到Web-Content中找有没有对应的html/jsp页面，如果没有再到WEB-INF目录下的xml配置文件中找映...

Hive三个内置date函数：datediff、date_sub、date_add用法

目录1. datediff（'endTime'，‘startTime’）2. date_sub（‘yyyy-MM-dd’，n/-m）3. date_add（'yyyy-MM-dd'，n/-m）ps：三个date函数日期均只能为'yyyy-MM-dd'格式 & 'yyyy-MM-dd HH:mm:s'格式1. datediff（'endTime'，‘startTime’）...

spark重要参数配置

目录区别点一：区别点二：同样是流式数据采集框架，flume一般用于日志采集，可以定制很多数据源，减少开发量，基本架构是一个flume进程agent（source、拦截器、选择器、channel<Memory Channel、File Channel>、sink），其中传递的是原子性的event数据；使用双层Flume架构可以实现一层数据采集，一层数据集合；Flu...

HiveSql中limit10的坑——对大数据量的表查询加group by

一般查询hive表中某个字段是否存在某个值，会使用如下查询语句select * from 表名 where dt=XXXX and 字段 like '%某个值%' limit 10；这种比较适合hive表数据量较小的情况，出现limit10，hive会默认判断此表数据量不大，只开启一个map进行查询，如果对于大表，比如好几百G上T的数据量，这么大的数据量只开一个map一方面查询慢，另一方面，因为数

Flume和Kafka的区别与联系

【搭建Hadoop集群】hadoop运行环境的搭建篇——虚拟机准备（看一篇成高手系列01）

共 16 条

请选择