cyp努力努力再努力个人主页

@weixin_53543905

cyp努力努力再努力

2023-02-01 11:50:09 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【Hadoop-OBS-Hive】利用华为云存储对象 OBS 作为两个集群的中间栈 load 文件到 Hive

本次需求：想将一个集群上的 csv 文件 load 到另一个集群的 Hive 表中，由于两个集群的网络不通，所以利用华为云存储对象 OBS 作为中间栈，从而实现。

#hadoop #hive #华为云

【Flink-Kafka-To-RocketMQ】使用 Flink 自定义 Sink 消费 Kafka 数据写入 RocketMQ

这里的 maven 依赖比较冗余，推荐大家都加上，后面陆续优化。2）代码实现注意：1、此程序中所有的相关配置都是通过 Mysql 读取的（生产环境中没有直接写死的，都是通过配置文件动态配置），大家实际测试过程中可以将相关配置信息写死。2、此程序中 Kafka 涉及到了 Kerberos 认证操作，大家的操作环境中没有的话可以去掉。2.2.conf2.2.1.ConfigTools读取 Mysql

#flink #kafka #rocketmq

【Flink-Kafka-To-Kafka】使用 Flink 实现 Kafka 数据写入 Kafka

需求描述：1、数据从 Kafka 写入 Kafka。2、相关配置存放于 Mysql 中，通过 Mysql 进行动态读取。3、此案例中的 Kafka 是进行了 Kerberos 安全认证的，如果不需要自行修改。4、Kafka 数据为 Json 格式，通过 FlatMap 扁平化处理后完成写入。5、读取时使用自定义 Source，写入时使用自定义 Sink。6、本地测试时可以编辑 resources.

#flink #kafka

【Flink-Kafka-To-Mongo】使用 Flink 实现 Kafka 数据写入 Mongo（根据对应操作类型进行增、删、改操作，写入时对时间类型字段进行单独处理）

需求描述：1、数据从 Kafka 写入 Mongo。2、相关配置存放于 Mysql 中，通过 Mysql 进行动态读取。3、此案例中的 Kafka 是进行了 Kerberos 安全认证的，如果不需要自行修改。4、Kafka 数据为 Json 格式，获取到的数据根据操作类型字段进行增删改操作。5、读取时使用自定义 Source，写入时使用自定义 Sink。6、消费 Kafka 数据时自定义反序列化。

#flink #kafka #mongodb

【Flink-Kafka-To-Mysql】使用 Flink 实现 Kafka 数据写入 Mysql（根据对应操作类型进行增、删、改操作）

需求描述：1、数据从 Kafka 写入 Mysql。2、相关配置存放于 Mysql 中，通过 Mysql 进行动态读取。3、此案例中的 Kafka 是进行了 Kerberos 安全认证的，如果不需要自行修改。4、Kafka 数据为 Json 格式，获取到的数据根据操作类型字段进行增删改操作。5、读取时使用自定义 Source，写入时使用自定义 Sink。6、消费 Kafka 数据时自定义反序列化。

#flink #kafka #mysql

【Flink-Kafka-To-Hive】使用 Flink 实现 Kafka 数据写入 Hive

需求描述：1、数据从 Kafka 写入 Hive。2、相关配置存放于 Mysql 中，通过 Mysql 进行动态读取。3、此案例中的 Kafka 是进行了 Kerberos 安全认证的，如果不需要自行修改。4、Flink 集成 Kafka 写入 Hive 需要进行 checkpoint 才能落盘至 HDFS。5、先在 Hive 中创建表然后动态获取 Hive 的表结构。6、Kafka 数据为 Js

#flink #kafka #hive

【Flink-Kafka-To-ClickHouse】使用 Flink 实现 Kafka 数据写入 ClickHouse

需求描述：1、数据从 Kafka 写入 ClickHouse。2、相关配置存放于 Mysql 中，通过 Mysql 进行动态读取。3、此案例中的 Kafka 是进行了 Kerberos 安全认证的，如果不需要自行修改。4、先在 ClickHouse 中创建表然后动态获取 ClickHouse 的表结构。5、Kafka 数据为 Json 格式，通过 FlatMap 扁平化处理后，根据表结构封装到 R

#flink #kafka #clickhouse

【Kafka-3.x-教程】-【二】Kafka-生产者-Producer

在消息发送的过程中，涉及到了两个线程 — — main 线程和 Sender 线程。在 main 线程中创建了一个双端队列 RecordAccumulator。main 线程将消息发送给 RecordAccumulator，Sender 线程不断从 RecordAccumulator 中拉取消息发送到 Kafka Broker。1、外部数据通过 Producer 生产者中的 main 线程，调用

#kafka #分布式 #大数据

【Kafka-3.x-教程】-【六】Kafka 外部系统集成【Flume、Flink、SpringBoot、Spark】

（3）在 main 下创建 scala 文件夹，并右键 Mark Directory as Sources Root -> 在 scala 下创建包名为 com.test.spark。可以用于 Kafka 的生产者，也可以用于 SpringBoot 的消费者。可以用于 Kafka 的生产者，也可以用于Flume 的消费者。Flink 是一个在大数据开发中非常常用的组件。可以用于 Kafka 的生产

#kafka #flume #flink +1

都 2024 年了！程序员的到底出路在哪里！？继续卷技术？晋升管理层？还是转业？

除了上述框架，大数据生态系统还包括其他技术和工具，如NoSQL数据库（如MongoDB、Cassandra）、数据仓库（如Amazon Redshift、Google BigQuery）、数据流处理工具（如Kafka、Storm）以及数据可视化工具（如Tableau、PowerBI）等。考公务员是程序员多元化职业发展路径中的一种选择，它提供了稳定的工作环境和相对固定的工作时间，但同时也可能意味着更

到底了