logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Azure databricks spark overwrite 全量更新的时候容易碰到的问题

1、 databricks spark overwrite 到的的时候会先TRUNCATE TABLE 然后再写入,就会碰到查询是空的情况,解决办法是用存储过程解决先写入_bak表,再通过存储过程改表名的方式完成替换。CALL DDL的在mysql的存储需要自己写哈。

文章图片
#azure#spark#flask
spark、pyspark 常用的模版 demo 网址

1、我自己有时候用百度或者其他的搜索出来的spark 常用案例,质量有的好有的差有时候就很烦。特地分享一个我常用的质量高的网站地址。

文章图片
#spark#大数据#分布式
spring boot 删mysql数据发生死锁参考几种方案总结

原因:因为删除数据的时候造成了区间锁,这个时间再写入并发大的情况下出现死锁的情况。1、把mysql 的事务级别调整到 read-committed (如果在生产会有潜在的风险)2、spring boot 的事务用注解 @Transactional(readOnly = false, propagation = Propagation.REQUIRES_NEW) 而不用spring boot默认的事

spring boot 定时器掉的坑

1、在项目中通过启定时器定时完成消费缓存中的数据启了好几个定时器2、在测试环境一直没有问题,但上生产总是太慢了今天 看了代码日志,发现是定时器处理这一块很慢但我明明设置了2秒处理一次可实际日志显示却要几分钟MMP3、查了下spring boot 定时器的数据情况发现spring boot 定时器默认是单线程,而我的项目中处理缓存中数据又多,会导致单个定时器一直占用线程4、给spring boot

pip install pycrypto 报错 error: command ‘C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\

pip intarll 报错  error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_amd64\\cl.exe' failed with exit code 2

#pip#microsoft#visual studio
报错 :no libwebkitgtk-1.0 detected, some features will be unavailable Consider installing the pack

1、今天安装kettle 起动的时候如下警告no libwebkitgtk-1.0 detected, some features will be unavailableConsider installing the package with apt-get or yum.e.g. 'sudo apt-get install libwebkitgtk-1.0-0'2、因为我用的是centos7.x

#etl
azure databricks 常用的JDBC连接

3、sqlservice的连接。4、posgresq的连接。2、oracle 的连接。1、mysql 的连接。

文章图片
#azure#microsoft
hbase 修改表中列的数据

ps: 今天前端的同事叫我给新增列的测试数据一下没想起来,hbase 怎么加,特此记忆put ‘表名’,‘rowkey’,‘列簇:列名’,‘值’

es 用 kibana 根据时间删除数据

时间小于多少删除数据POST sms_index/_delete_by_query{"query": {"range": {"auditTime": {"lt":"2020-03-14T03:09:11.989Z"}}}}

到底了