streamsets-datacollector 安装与启动
streamsets-datacollector-all-3.21.0 安装步骤1.安装jdk8jdk安装网上教程很多,在这就不详细记录了2.下载streamsets官网https://archives.streamsets.com/index.html 注册账户后下载 Full TarballTarball for Linux(Tarball sha1)在下载的过程中 我们可以创建几个能用到的文
streamsets-datacollector-all-3.21.0 安装步骤
1.安装jdk8
jdk安装网上教程很多,在这就不详细记录了
2.下载 streamsets
官网 https://archives.streamsets.com/index.html 注册账户后
下载 Full Tarball Tarball for Linux (Tarball sha1)
在下载的过程中 我们可以创建几个能用到的文件夹
mkdir
/data/streamsets/data
mkdir
/data/streamsets/log 存放log的地方
mkdir
/data/streamsets/resources
3.下载完成后解压
cd /opt/streamsets-datacollector-3.21.0/
tar zxf streamsets-datacollector-all-3.21.0.tgz
4.配置
1)配置环境变量
# 切换root用户
vi
/etc/profile
# 在文件最后添加
export
SDC_DIST=/opt/
streamsets-datacollector-3.21.0
export SDC_JAVA_OPTS="${SDC_JAVA_OPTS} -Xmx10240m -Xms10240m -server" 这个加不加都行
# 保持退出
wq
# 应用环境变量
source
/etc/profile
# 测试环境变量
echo
$SDC_DIST
2)配置strameset环境
cd /opt/streamsets-datacollector-3.21.0/libexec/
vim sdc-env
.sh
这块改下 jvm 看需求改 改不改都行
在就是添加
export
SDC_DATA=
/data/streamsets/data
export
SDC_LOG=
/data/streamsets/log
export
SDC_RESOURCES=
/data/streamsets/resources
3)配置 sdc.properties
cd /opt/streamsets-datacollector-3.21.0/etc
在这个配置文件里主要配置这几项
production.maxBatchSize 一次抽取数量 (按照自身需求和硬件配置来调整)
runner.thread.pool.size 一次可以开多少个线程,换句话说就是能开几个pipeline 如果你需要的抽取的表比较多 建议多开启 要不会报错
其他的 暂时都不用动,如果有需求可以去官网看看
4)如果需要kafka hbase等 需要配置hosts文件
5)如果需要使用mysql数据库的话
需要开启mysql binlog
5。 启动
nohup
bin
/streamsets
dc
& 帐号密码都是 admin
6.错误 (持续整理)
1)Java 1.8 detected; adding $SDC_JAVA8_OPTS of "-XX:+UseConcMarkSweepGC -XX:+UseParNewGC -Djdk.nio.maxCachedBufferSize=262144" to $SDC_JAVA_OPTS
Configuration of maximum open file limit is too low: 1024 (expected at least 32768). Please consult https://goo.gl/6dmjXd
修改 :vi /etc/security/limits.conf
添加
root soft nofile 65535
root hard nofile 65535
* soft nofile 65535
* hard nofile 65535
本地服务器需要重启
2)mysqlbinlog 0701 initiation error 连接不上jdbc
进去后 确定 jdbc 和binglog 都是安装成功后
进入
cd /opt/streamsets-datacollector-3.21.0/streamsets-libs-extras
创建 streamsets-datacollector-jdbc-lib和streamsets-datacollector-mysql-binlog-lib 在这两个文件夹下 分别在创建lib后
在网上下载 mysql-connector-java-5.1.46.jar PS 我只知道在网上下载 如果有其他方式 请告知 多谢!
重启服务
更多推荐
所有评论(0)