
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大数据学习过程中,经常会用到的linux命令,以及常见的坑和解决办法。1. 按修改时间排序当前文件夹内容ll -rt//按时间排序。r表示倒序,t表示按修改时间排序。2.移动和复制的标准写法mv dir1 src/dir1//移动文件夹到指定目录cp -r dir2 src/dir2 //复制文件夹到指定目录3.查看大文件more:空格下翻,无法回退,q退出les...
SparkSQL主要通过Antlr4定义SQL的语法规则,完成SQL词法,语法解析,最后将SQL转化为抽象语法树。所以有必要先了解下Antlr4的工作流程。

【代码】Flink入门系列07-延迟数据处理。
把当前目录的所有文件名后追加".txt"方式一:for i in *do mv $i $i".txt"done方式二:ls | xargs -t -i mv {} {}.txt-t 表示先打印,在执行。-i 表示把每项的名称替换为指定字符,如:{}
需求如题,取出json字符串中brandName的值。样本数据:有两个字段:id,brandidbrand1[{“brandList”:[{“brandId”:“752”,“brandName”:“xxx752”},{“brandId”:“516”,“brandName”:“xxx516”},{“brandId”:“650”,“brandName”:“xxx650”},{...
Kafka是一种分布式的、基于发布/订阅的消息缓存系统。(依赖于zookeeper)一、特性:消息持久化高吞吐量,每秒百万级扩展能力强支持多种语言实时性:生产者的message立即被消费者可见二、要点:1、kafka是一个分布式的消息缓存系统。2、kafka集群中的服务器都叫做broker。3、kafka有两类客户端,一类叫producer(消息生产者)...







