logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何在AWS上构建Apache DolphinScheduler

社区的活跃不仅仅体现在代码产出上,更重要的是社区的建设和生态的完善。首先我们可以看一下下面这张图,这张图是亚马逊云科技数据分析的服务的一个整体介绍,这里边会去按照像刚才的开源项目的一些分类,就是我们把从数据接入、数据处理、数据湖再到数据分析,还有一些结合 AI 模型 learning 的一些服务,做了一个分类。随着云计算技术的发展,Amazon Web Services (AWS) 作为一个开放的

#大数据
途家大数据平台基于 Apache DolphinScheduler 的探索与实践

点击上方蓝字关注我们途家在2019 年引入 Apache DolphinScheduler,在不久前的 Apache DolphinScheduler 2 月份的 Meetup上,途家...

#大数据#数据库#java +2
奇富科技:大数据任务从诊断到自愈的实践之路

比如在这个诊断建议中,就说明“数据同步,目前只支持orc格式,请创建orc格式的hive表”,用户就明白可以将自己的Hive表格式转为orc格式解决这个异常。还有一种情况是,数据质量的弱校验规则,数据质量比对没有通过。还有“同步0记录”诊断规则,比如DataX将Hive表数据同步到Mysql时,如果同步了0条数据,虽然同步任务成功了,我们也会在工作流页面提示出来。其次,通过自助查询提交的Spark

#大数据
ApacheCon精彩回顾|思科网讯DolphinScheduler与k8S整合实践,提高大数据处理效率!...

点亮⭐️Star· 照亮开源之路GitHub:https://github.com/apache/dolphinscheduler //在 ApacheCon Asia 2022 上,思科网讯(Cisco Webex) 技术经理 刘丁政 分享了关于 Apache DolphinScheduler 与 Kubernetes 结合进行大数据处理。让我们探索一下思科网讯在 Apache D...

#大数据#hadoop#数据库 +2
Apache DolphinScheduler 官方发布3.2.0版本!大数据调度【重磅更新】

今天,Apache DolphinScheduler 3.2.0 版本在万众期待中终于发布了!在之前的预告中,包括,以及《文章汇总已经大致覆盖了 3.2.0 版本的全新功能和优化。现在,来看看新版本的全新“样貌”吧!

#大数据
DolphinScheduler×思科网讯:k8S整合实践,提高大数据处理效率!

点击蓝字 关注我们用户案例 | 思科网讯思科网讯(Cisco Webex)是一家开发和销售在线会议、视频会议、云呼叫服务和联络中心作为服务应用程序的软件公司,团队设计并搭建了大数据平台,服务于组合产品的数据注入和工作负载的数据处理。以 Webex 会议产品为例,Webex 会议会生成各种指标,当召开会议时,客户端和服务器都会向 Kafka 集群发送大量指标和日志,外部和内部客户都依赖这些指标来优化

#kubernetes#大数据#kafka +2
全方位解读SeaTunnel MySQL CDC连接器:实现数据高效同步的强大工具

在当今数据快速增长的时代,实时、高效地同步和处理来自各种数据源的信息成为了企业和开发者面临的重要挑战。MySQL作为广泛使用的数据库之一,其变更数据捕获(CDC)功能对于实现这一目标至关重要。在这篇文章中,我们将深入探讨MySQL CDC源连接器在SeaTunnel框架下的应用,涵盖从基础设置到高级配置的各个方面。MySQL CDC源连接器。

#大数据
利用 Amazon EMR Serverless、Amazon Athena、Apache Dolphinscheduler 以及本地 TiDB 和 HDFS 在混合部署环境中构建无服务器数据仓库

金融科技客户非常注重数据安全和合规。为规避潜在的风险,本案例所涉及的客户的做法是将用户的出入金数据、用户的基础数据(统称为业务数据)放在 IDC,而用户的行为数据以及脱敏之后的业务数据放在云马逊云科技平台中。从亚马逊云科技所服务的全球范围内的 FSI 行业客户看,越来越多的金融科技公司选择将业务数据也存放在亚马逊云科技平台上。亚马逊云科技为客户提供的云平台及服务在安全和合规方面积累了非常丰富的认证

文章图片
#大数据
数据分析师干了专业数仓工程师的活,自如是怎么做到的?

点击蓝字关注我们数据分析师作为企业数据资产的缔造者之一,具有一定的维度与指标体系管理、血缘分析、ETL 调度平台等技能。能够灵活使用调度平台会为数据分析师带来很大的便利,然而对于编程技能水平参差不齐的数据分析师来说,一个操作简单,使用成本低的调度平台才能让他们如虎添翼,而不是增加额外的学习成本。与大多企业相比,自如大数据平台的独特之处在于,大量的数仓加工并非由专业的数仓工...

#大数据#编程语言#java +2
元数据:数据治理的基石

点击上方蓝字关注DolphinScheduler(海豚调度)背景据说,英语中元数据meta一词最早出现于1968年,其是对希腊语前缀"meta-"的粗略翻...

#大数据#编程语言#数据分析 +2
    共 46 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择