
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
从一个sql引发的hive谓词下推的全面复盘及源码分析(下)
网上有太多写hive谓词下推的文章,但因为版本问题,不够全面,也不够准确了。影响谓词下推的不仅仅有PPD优化器,还有CBO。该文章【上篇】主要介绍谓词下推的规则及结论,【下篇】从源码层面跟踪hive是怎么做的优化
数据仓库开发人员怎么避免成为取数机器?
从事互联网数据仓库工作好多年了,其中最大的感触就是数据仓库开发人员每天做的最多的工作就是为业务方取数。简单重复的取数工作,一方面很难让大家在技能上有提高,另一方面也慢慢的消磨了大家的积极性和意志,也让大家极没有存在感。
json_tuple一定比 get_json_object更高效吗?
我们在实际用的时候,不要盲从,用get_json_object也是没关系的,况且正常情况下,一次也不会取成千上万个key值... 重要的是要保证,我们的json字符串一定不要存的太长,太大,这样的话,不管用哪个函数,效率都不会好
到底了







