Monmently 个人主页

@qq_37748919

Monmently

2023-01-18 16:05:15 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

基金api接口实时数据

基金实时信息：http://fundgz.1234567.com.cn/js/001186.js?rt=1463558676006001186为基金代号返回值：jsonpgz({“fundcode”:“001186”,“name”:“富国文体健康股票”,“jzrq”:“2016-05-17”,“dwjz”:“0.7420”,“gsz”:“0.7251”,“gszzl”:"-2.28",“gztim

Hive的底层计算框架默认是MapReduce，还有两种是Tez和Spark这几种的区别是什么？计算速度上为什么会有明显的差异？

mapreduce:基于磁盘的迭代,中间结果保存在文件中spark:基于内存的,中间结果无需落地磁盘，减少了磁盘IO的操作,DAG计算模型-可以减少shuffle次数sparkmrspark遇到宽依赖才会发生shuffle一次mr任务就会发生一次spark在map端会完成排序mr在reduce端会进行归并排序spark先放内存mr直接放磁盘tez:也有dag有向无关图，container重用，但部

#大数据 #spark

数据仓库中的数据生命周期管理

数据生命周期管理能帮助企业合理利用资源，优化数据仓库性能，并确保符合合规要求。从数据采集到销毁的每个阶段都需要严密规划和执行，为业务提供可靠的数据支持。

#数据仓库 #大数据 #hive +2

到底了