logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

doris 启动be报错

报错:./start_be.sh: 行 325: 11605 段错误 ${LIMIT:+${LIMIT}} "${DORIS_HOME}/lib/doris_be" "$@" 2>&1 < /dev/null

文章图片
#java#linux#开发语言
Idea连接GitLab的过程以及创建在gitlab中创建用户和群组

Idea连接GitLab的过程以及在gitlab中创建用户和群组

文章图片
#gitlab#idea#大数据
数据仓库介绍_数仓设计 (四)

优秀可靠的数仓体系,需要良好的数据分层结构。合理的分层,能够使数据体系更加清晰,使复杂问题得以简化。以下是该项目的分层规划

文章图片
#数据仓库#大数据#flink +2
数据仓库介绍_数仓介绍(一)

数据仓库是一个为数据分析而设计的企业级数据管理系统。数据仓库可集中、整合多个信息源的大量数据,借助数据仓库的分析能力,企业可从数据中获得宝贵的信息进而改进决策。同时,随着时间的推移,数据仓库中积累的大量历史数据对于数据科学家和业务分析师也是十分宝贵的。数据仓库核心架构系统数据流程图Flink实时数仓数据流程图普通实时计算与实时数仓比较普通的实时计算优先考虑时效性,所以从数据源采集经过实时计算直接得

文章图片
#数据仓库#大数据
数据仓库介绍_维度表(三)

维度表是维度建模的基础和灵魂。前文提到,事实表紧紧围绕业务过程进行设计,而维度表则围绕业务过程所处的环境进行设计。维度表主要包含一个主键和各种维度字段,维度字段称为维度属性。

文章图片
#数据仓库#数据库#oracle
MaxWell实时监控Mysql并把数据写入到Kafka主题中

MaxWell实时监控Mysql把数据写入到Kafka主题中

文章图片
#mysql#kafka#zookeeper +4
解决:Flink向kafka写数据使用Producer精准一次(EXACTLY_ONCE)异常

Caused by: org.apache.kafka.common.KafkaException: Unexpected error in InitProducerIdResponse; The transaction timeout is larger than the maximum value allowed by the broker (as configured by transact

文章图片
#flink#kafka#大数据
Kafka架构深入(进阶介绍 三)

Kafka中消息是以topic进行分类的,生产者生产消息,消费者消费消息,都是面向topic的。topic是逻辑上的概念,而partition是物理上的概念,,该log文件中存储的就是producer生产的数据。Producer生产的数据会被不断追加到该log文件末端,且每条数据都有自己的offset。消费者组中的每个消费者,都会实时记录自己消费到了哪个offset,以便出错恢复时,从上次的位置继

文章图片
#kafka#架构#分布式
Kafka概述(基础介绍 一)

Kafka是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。Kafka是一个分布式的数据流式传输平台。在流式计算中,Kafka一般用来缓存数据,Spark通过消费Kafka的数据进行计算。1.Apache Kafka是一个开源消息系统,由Scala写成。是由Apache软件基金会开发的一个开源消息系统项目。2.Kafka最初是由LinkedIn

文章图片
#kafka#分布式
当在使用flinksql的left join出现撤回流该如何解决?

在 Flink SQL 中,INNER JOIN、RIGHT JOIN 和 FULL OUTER JOIN 操作会因为数据变化而产生撤回流。这是为了确保流处理的结果一致性和准确性。在设计流处理应用时,需要考虑这些撤回流的影响,选择合适的 sink connector,例如 upsert-kafka,以正确处理这些操作

文章图片
#flink#kafka#大数据
到底了