logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据技术之DataX (一)DataX插件开发

文章目录一、背景二、基于java的本地测试datax2.1 github上下载datax的源代码2.2datax代码导入idea三、docker安装南大通用数据库GBase和GBase 8a3.1 docker安装Gbase 8a3.2 docker安装Gbase 8s三、南大通用数据库GBase 8sToGBase 8a3.1 GBase 8s的reader读插件开发(writer同理)四、南大

#java#big data
Kafka日志存储原理

引言Kafka中的Message是以topic为基本单位组织的,不同的topic之间是相互独立的。每个topic又可以分成几个不同的partition(每个topic有几个partition是在创建topic时指定的),每个partition存储一部分Message。借用官方的一张图,可以直观地看到topic和partition的关系。partition是以文件的形式存储在文件系统中,比如...

京东爬虫记录

一个博主的京东爬虫,自己改写成爬取京东书籍。两个爬虫:1、爬取京东书籍信息。2、爬取京东评论信息公用文件:JingdongspiderItem、MySQLPipeline、settings1、爬取京东书籍信息# -*- coding: utf-8 -*-import requestsfrom jingdongspider.items import Jingdongspider...

大数据之路阿里巴巴实践

大数据平台研发,全局概览导向。

文章图片
#大数据
一个免费好用的全域数据集成平台

免费好用的全域数据集成平台

文章图片
#大数据
大数据技术之DataX (一)DataX插件开发

文章目录一、背景二、基于java的本地测试datax2.1 github上下载datax的源代码2.2datax代码导入idea三、docker安装南大通用数据库GBase和GBase 8a3.1 docker安装Gbase 8a3.2 docker安装Gbase 8s三、南大通用数据库GBase 8sToGBase 8a3.1 GBase 8s的reader读插件开发(writer同理)四、南大

#java#big data
暂无文章信息