
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2.13.1 什么是Impala?Impala是cloudera提供的一款高效率的Sql查询工具,提供实时的查询效果,官方测试性能比Hive快10到100倍,其Sql查询比SparkSql还要更加快速,号称是当前大数据领域最快的查询Sql工具;Impala是基于Hive并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点;2.13.2 Impala与Hive的区别(1)相同点① Imp
1 Pulsar的常用命令1.1 client客户端Pulsar 的 Local模式的基本使用:(1)生产数据bin/pulsar-client produce my-topic --messages “hello-pulsar”说明:向my-topic这个topic生产数据,内容为“hello-pulsar”,如果topic不存在,pulsar会自动创建;(2)消费数据bin/pulsar-cl
数据清洗ETL代码实现package com.it.lkw.etl;public class LogBean {private String remote_addr;// 记录客户端的ip地址private String remote_user;// 记录客户端用户名称,忽略属性"-"private String time_local;// 记录访问时间与时区...
数据库面试题1 Mysql的事务Mysql事务主要用于处理操作量大,复杂度高的数据。比如说,在人员管理系统中,你删除一个人员,你既需要删除人员的基本资料,也要删除和该人员相关的信息,如信箱,文章等等,这样,这些数据库操作语句就构成一个事务;1.1事务的基本要素(ACID)● 原子性(Atomicity):原子性是指事务是一个不可分割的工作单位,事务中的操作要么都发生,要么都不发生。● 一致性(Co
代码已经在我的github上:添加链接描述