
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
spark ui的job数,stage数以及task数
spark job stage task的关系

spark sql 的join调优
spark sql的join调优

spark机器学习-分类回归总结
1.spark支持的分类包括以下几个场景:a.二分类,顾名思义就是只分成A和B两类b.多分类分成A,B,C,D等多个分类不支持多标签分类,所谓的多标签分类是指一个样本可以属于多个分类,也就是比如样本X既属于A分类又属于B分类,spark目前不支持分类的算法主要有逻辑回归分类算法,决策树,随即森林等,不管是哪种算法,不同点主要在于支持的分类数量和样本数量的限制不同,评价分类算法的好坏的标志主要是看准
spark 的group by ,join数据倾斜调优
spark处理数据倾斜

kafka性能高的影响因素
1.使用操作系统的页缓存kafka的性能非常依赖于操作系统的页缓存,页缓存提供了比kafka进程内存更好的缓存方式。2.零拷贝(linux的sendfile函数,对应FileChannel.transferto函数)正常的从磁盘发送数据到网络要经过一下几个步骤:a.把数据从磁盘读取到内核的read buffer内存中b.把内核read buffer内存的数据读取到应用程序的用户内存uer buff
flink中值得监控的几个指标
flink监控指标

Hbase架构图及数据存储格式
hbase架构图hbase数据存储格式hbase存储

mybatis打印sql日志
sql打印日志mybatis打印日志mybatis支持打印日志到logback中

mysql 通过不同索引更新相同记录会导致死锁吗
mysql 死锁 mysql update死锁 mysql 锁原理
clickhouse从mysql同步数据到clickhouse的几种方式
从mysql同步数据到ck的几种方式








