Databricks 在 Gartner DBMS 和 DSML 2021 魔力象限中均被评为领导者。作为一名始终需要赶上最新技术趋势的数据顾问,Databricks 认证成为我的首要考试目标。

这个故事旨在快速分享我如何分配时间以在 2 周内有效地获得 Databricks 认证数据工程师助理。

什么是 Databricks?

以防万一您不知道什么是 Databricks,但您正在阅读这个故事。这是关于 Databricks 的快速介绍,

  • 这不是编程语言。 Databricks 是一个数据库管理系统/数据科学和机器学习数据平台,它可以支持数据中的各种编程语言(例如 SQL、Python、R、Scala)

  • 一个平台上的所有数据、分析和人工智能 — Databricks 设计为湖屋解决方案的关键卖点之一,它统一了数据团队的运营,可以支持数据工程、数据科学和数据分析师任务(例如仪表板, ad-hoc SQL 查询) '

  • 采用Delta Lake、MLflow、Spark结构化流等。 — 这些现代数据技术可优化 Databricks 中的数据操作/处理

关于我自己的一点背景

我不是一个绝对的初学者。 SQL 和 Python 知识帮助我快速掌握很多主题,尤其是与 SQL / Python 相关的语法(例如 CTE、join、UDF)。

  • 6年+SQL经验

  • 2 年 + Python 经验

  • 0 关于 Databricks、Lakehouse 设计和 Delta Lake 的知识

如果您在 SQL / Python 方面的经验为零,则可能需要更多时间来熟悉基本语法和实验室课程来体验和玩耍。

考试详情

Databricks 认证数据工程师助理认证考试评估个人使用 Databricks Lakehouse 平台完成介绍性数据工程任务的能力。这包括了解 Lakehouse 平台及其工作空间、架构和功能。

以下考试详细信息来自 Databricks 截至 2022 年 8 月,您可以随时在此处参考他们的最新详细信息

时长: 90 分钟

题目: 45道选择题(没有选择题)

问题分布:

  • Databricks Lakehouse 平台 — 24% (11/45)

  • ELT 与 Spark SQL 和 Python — 29% (13/45)

  • 增量数据处理 — 22% (10/45)

  • 生产管道 — 16% (7/45)

  • 数据治理 — 9% (4/45)

费用: $200

结果: 完成考试后即可获得考试结果。徽章将在几个工作日内提供

策略和时间分配

我确实遵循了 Databricks 推荐的路径,如下所示,

资料来源:Databricks

我的公司是 Databricks 的合作伙伴,我们可以免费访问他们的在线课程。根据我的经验,他们的在线课程确实涵盖了考试中的所有主题,并且有足够的深度。但是您还应该建立自己的实验室并练习代码和语法,还可以在线查看他们的文档以了解某些概念(例如自动加载器、检查点——它们如何偏移位置)。

资料来源:Databricks

1.Databricks Lakehouse 平台认证基础知识(课程时长:30 分钟)

2.Databricks 的数据工程(课程时长:12 小时)

3.考试信息:Databricks Certified Associate Data Engineer(需额外付费)(课程时长:< 15 分钟)

4.认证概述:Databricks认证数据工程师助理考试(课程时长:1小时)

总课程学习: 大约 14 小时(但我通常使用 1.5 倍速度,所以总共 9 小时)

我的时间分配

第 1 周:

  • 研究Databricks Lakehouse 平台认证的基础知识

  • 学习使用 Databricks 进行数据工程

  • 完成第一次尝试练习考试,得分仅为 65–70%

平均而言,我每天平均花费 1-2 小时学习。在整个课程中,您还可以跟随实验室和练习,但这会花费您更多的时间。我只是简单地阅读并理解了语法,而无需在 Azure/AWS/GCP 上设置实验室。

第 2 周:

  • 阅读考试信息:Databricks 认证助理数据工程师(需额外付费)

  • 学习认证概述:Databricks 认证数据工程师助理考试

  • 实验室实践和语法深入研究(我已经使用 Azure 试用版以最少的配置工作来设置环境)

  • 周中二试练习考试

  • 实际考试前的期末练习考试

在整个实验室实践中,我确实阅读了很多文章/Databricks 文档来解释可用的参数和选项,但是您可以按照从 Databricks 到每个主题的实验室流程进行深入研究。

有用的链接/材料

  • 练习考试— 强烈建议您在参加实际考试之前尝试几次练习考试

  • 考试准备幻灯片— 在线课程中使用的幻灯片

  • 课程代码 repo— 按主题在实验会话中使用的源代码

  • Databricks Notebook 查看器— 如果您没有 AWS/Azure/GCP 的试用版或者您懒得设置,您可以查看器打开 dbc 文件

希望我的建议可以帮助和指导您准备考试。请继续关注我的下一次考试分享和技巧!

了解更多关于考试分享和技巧的信息

[

从零到 Azure 云架构师——你的云之旅指南

推动您的 Azure 云之旅的指南,其中包含明确的方向和有用的提示

tech-for-future.medium.com

](/从零到天蓝色的云架构师指南为您的云之旅-c0baffbc3a56)

Logo

华为、百度、京东云现已入驻,来创建你的专属开发者社区吧!

更多推荐