logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DataX3.0+DataX-Web部署分布式可视化ETL系统

DataX 是阿里云 DataWorks 数据集成的开源版本,主要就是用于实现数据间的离线同步。DataX 致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源(即不同的数据库) 间稳定高效的数据同步功能。

文章图片
#分布式#etl#数据仓库
使用Docker部署DataX3.0+DataX-Web

注意:datax_web:3.0.1镜像已经整合了datax3.0和datax-web,整合后的镜像大小约990M。1、准备基础镜像,开通所需端口。

文章图片
#docker#分布式#etl
到底了