— 如何在 2 周内通过 Databricks 认证数据工程师助理
Databricks 在 Gartner DBMS 和 DSML 2021 魔力象限中均被评为领导者。作为一名始终需要赶上最新技术趋势的数据顾问,Databricks 认证成为我的首要考试目标。 这个故事旨在快速分享我如何分配时间以在 2 周内有效地获得 Databricks 认证数据工程师助理。 什么是 Databricks? 以防万一您不知道什么是 Databricks,但您正在阅读这个故事。
Databricks 在 Gartner DBMS 和 DSML 2021 魔力象限中均被评为领导者。作为一名始终需要赶上最新技术趋势的数据顾问,Databricks 认证成为我的首要考试目标。
这个故事旨在快速分享我如何分配时间以在 2 周内有效地获得 Databricks 认证数据工程师助理。
什么是 Databricks?
以防万一您不知道什么是 Databricks,但您正在阅读这个故事。这是关于 Databricks 的快速介绍,
-
这不是编程语言。 Databricks 是一个数据库管理系统/数据科学和机器学习数据平台,它可以支持数据中的各种编程语言(例如 SQL、Python、R、Scala)
-
一个平台上的所有数据、分析和人工智能 — Databricks 设计为湖屋解决方案的关键卖点之一,它统一了数据团队的运营,可以支持数据工程、数据科学和数据分析师任务(例如仪表板, ad-hoc SQL 查询) '
-
采用Delta Lake、MLflow、Spark结构化流等。 — 这些现代数据技术可优化 Databricks 中的数据操作/处理
关于我自己的一点背景
我不是一个绝对的初学者。 SQL 和 Python 知识帮助我快速掌握很多主题,尤其是与 SQL / Python 相关的语法(例如 CTE、join、UDF)。
-
6年+SQL经验
-
2 年 + Python 经验
-
0 关于 Databricks、Lakehouse 设计和 Delta Lake 的知识
如果您在 SQL / Python 方面的经验为零,则可能需要更多时间来熟悉基本语法和实验室课程来体验和玩耍。
考试详情
Databricks 认证数据工程师助理认证考试评估个人使用 Databricks Lakehouse 平台完成介绍性数据工程任务的能力。这包括了解 Lakehouse 平台及其工作空间、架构和功能。
以下考试详细信息来自 Databricks 截至 2022 年 8 月,您可以随时在此处参考他们的最新详细信息
时长: 90 分钟
题目: 45道选择题(没有选择题)
问题分布:
-
Databricks Lakehouse 平台 — 24% (11/45)
-
ELT 与 Spark SQL 和 Python — 29% (13/45)
-
增量数据处理 — 22% (10/45)
-
生产管道 — 16% (7/45)
-
数据治理 — 9% (4/45)
费用: $200
结果: 完成考试后即可获得考试结果。徽章将在几个工作日内提供
策略和时间分配
我确实遵循了 Databricks 推荐的路径,如下所示,
资料来源:Databricks
我的公司是 Databricks 的合作伙伴,我们可以免费访问他们的在线课程。根据我的经验,他们的在线课程确实涵盖了考试中的所有主题,并且有足够的深度。但是您还应该建立自己的实验室并练习代码和语法,还可以在线查看他们的文档以了解某些概念(例如自动加载器、检查点——它们如何偏移位置)。
资料来源:Databricks
1.Databricks Lakehouse 平台认证基础知识(课程时长:30 分钟)
2.Databricks 的数据工程(课程时长:12 小时)
3.考试信息:Databricks Certified Associate Data Engineer(需额外付费)(课程时长:< 15 分钟)
4.认证概述:Databricks认证数据工程师助理考试(课程时长:1小时)
总课程学习: 大约 14 小时(但我通常使用 1.5 倍速度,所以总共 9 小时)
我的时间分配
第 1 周:
-
研究Databricks Lakehouse 平台认证的基础知识
-
学习使用 Databricks 进行数据工程
-
完成第一次尝试练习考试,得分仅为 65–70%
平均而言,我每天平均花费 1-2 小时学习。在整个课程中,您还可以跟随实验室和练习,但这会花费您更多的时间。我只是简单地阅读并理解了语法,而无需在 Azure/AWS/GCP 上设置实验室。
第 2 周:
-
阅读考试信息:Databricks 认证助理数据工程师(需额外付费)
-
学习认证概述:Databricks 认证数据工程师助理考试
-
实验室实践和语法深入研究(我已经使用 Azure 试用版以最少的配置工作来设置环境)
-
周中二试练习考试
-
实际考试前的期末练习考试
在整个实验室实践中,我确实阅读了很多文章/Databricks 文档来解释可用的参数和选项,但是您可以按照从 Databricks 到每个主题的实验室流程进行深入研究。
有用的链接/材料
-
练习考试— 强烈建议您在参加实际考试之前尝试几次练习考试
-
考试准备幻灯片— 在线课程中使用的幻灯片
-
课程代码 repo— 按主题在实验会话中使用的源代码
-
Databricks Notebook 查看器— 如果您没有 AWS/Azure/GCP 的试用版或者您懒得设置,您可以查看器打开 dbc 文件
希望我的建议可以帮助和指导您准备考试。请继续关注我的下一次考试分享和技巧!
了解更多关于考试分享和技巧的信息
[
从零到 Azure 云架构师——你的云之旅指南
推动您的 Azure 云之旅的指南,其中包含明确的方向和有用的提示
tech-for-future.medium.com
](/从零到天蓝色的云架构师指南为您的云之旅-c0baffbc3a56)
更多推荐
所有评论(0)