如果您正在申请入门级数据工程职位,并且您正在接受来自工程或数据团队的人的独家面试,那么招聘人员只有两个标准 -

  1. 他们需要一些基本的 DE 特定技能

  2. 他们需要一些他们需要的东西

1.几张照片!

标准的 DE 工具是 Airflow、SQL、Python+Pandas 和 dbt。你需要覆盖一个 DE 云堆栈。对于 GCP,它是:BQ 和云存储。对于 ETL 流程,它可以是任何东西:Cloud Function、Compute Engine 或 Dataflow。

BI 工具...老实说,在 DE 中您不需要那么多 BI 工具。 BI 工具领域对于 DE 来说是一个滑坡,因为 BI 工具的列表是无穷无尽的,而 BI 是一个与 DE 不同的领域。一个认真的招聘人员除了你听说过他们正在使用的工具外,不会要求任何其他东西。但是,如果您构建了仪表板或其他东西总是好的,但在我看来,这并不是非常必要的。

这与 Spark 或 Kafka 的建议几乎相同。了解他们的工作,并对语法有所了解。如果数据团队使用 Spark 或 Kafka,他们不会期望您在最初的 2-3 个月内接触这些项目。

2.需求

我认为您可以在 6 个月内获得基本 DE 技能集的操作知识。但关键是需要因素。需要因素可以是很多东西。每家公司都是不同的,他们都需要使他们与众不同的东西。

就像斯卡拉一样。如果您了解 Scala 并且有人在他们的堆栈中使用 Scala,那么即使您没有 Spark 的实践经验,他们也会尽最大努力雇用您。如果他们使用像 Rust 这样的东西,而只有少数 DE 使用 Rust,他们会尝试雇佣你。

如果他们广泛使用一种在 DE 中通常不优先考虑的方法,他们会尝试为它招聘。就我而言,它是网络抓取。因为我对自己的网络爬虫技术很有信心,所以即使我没有太多的 DE 经验,拥有大型网络爬虫业务的公司也会尽力雇用我。我还接受了一些采访,因为他们正在处理晦涩的文档。我说,我已经基于 OLD YouTube API 文档(知道的人知道)构建了一个项目。他们竭尽全力聘请我。

现在有趣的部分是 BI/Dashboard 和 Spark/Kafka 适合这里。在我看来,它们不属于基本需求标准。这些是某些 DE 团队的特殊需求。如果您使用过它们或使用它们构建项目,那么您将在广泛使用这些工具的团队中拥有优势。但它们不会让你在任何地方都有优势,因为并非所有 DE 团队都使用它们。这个需求因素就是为什么一些 DE 招聘人员更喜欢程序员而不是数据分析师,反之亦然,因为招聘人员带来的技能可以满足他们的特定需求。

本质上,我是说需求标准如此多样化,您无法预测自己的方式。所以专注于你喜欢的与 DE 相关的事情。这听起来像是感觉良好的建议,但这正是我的想法。能够编写 Java 的人不应该专注于构建仪表板;他们可以专注于学习 Scala 或 Rust。如果你对数据分析或 BI 感兴趣,那么如果你试图学习 Scala 而没有得到报酬,那你就是在浪费时间。


作者:anyfactor

Logo

学AI,认准AI Studio!GPU算力,限时免费领,邀请好友解锁更多惊喜福利 >>>

更多推荐