logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据技术中常用的Linux命令

大数据学习过程中,经常会用到的linux命令,以及常见的坑和解决办法。1. 按修改时间排序当前文件夹内容ll -rt//按时间排序。r表示倒序,t表示按修改时间排序。2.移动和复制的标准写法mv dir1 src/dir1//移动文件夹到指定目录cp -r dir2 src/dir2 //复制文件夹到指定目录3.查看大文件more:空格下翻,无法回退,q退出les...

SparkSQL源码分析系列03-Antlr4分析测试

SparkSQL主要通过Antlr4定义SQL的语法规则,完成SQL词法,语法解析,最后将SQL转化为抽象语法树。所以有必要先了解下Antlr4的工作流程。

文章图片
#spark
Flink入门系列07-延迟数据处理

【代码】Flink入门系列07-延迟数据处理。

#flink#大数据
Linux批量追加文件名后缀

把当前目录的所有文件名后追加".txt"方式一:for i in *do mv $i $i".txt"done方式二:ls | xargs -t -i mv {} {}.txt-t 表示先打印,在执行。-i 表示把每项的名称替换为指定字符,如:{}

sql之取出json字符串中指定字段的值

需求如题,取出json字符串中brandName的值。样本数据:有两个字段:id,brandidbrand1[{“brandList”:[{“brandId”:“752”,“brandName”:“xxx752”},{“brandId”:“516”,“brandName”:“xxx516”},{“brandId”:“650”,“brandName”:“xxx650”},{...

Kafka详解

Kafka是一种分布式的、基于发布/订阅的消息缓存系统。(依赖于zookeeper)一、特性:消息持久化高吞吐量,每秒百万级扩展能力强支持多种语言实时性:生产者的message立即被消费者可见二、要点:1、kafka是一个分布式的消息缓存系统。2、kafka集群中的服务器都叫做broker。3、kafka有两类客户端,一类叫producer(消息生产者)...

到底了