这个迷你分步指南涵盖以下内容:

  • 设置谷歌云平台

  • 在 BigQuery 中加载公共数据集

  • 在 BigQuery 中运行 SQL 查询并将查询保存到 BigQuery 表中

图片:https://cloud.google.com/bigquery

BigQuery 提供了巨大的存储容量来存储可以使用 SQL 查询轻松访问的海量数据集。作为一个包含 TB 和 PB 级数据的数据仓库,BigQuery 完全由 Google 管理,可用于通过、Google Cloud Platform 控制台、BigQuery REST API调用或命令中的 Web UI 访问 BigQuery -线工具。

本文介绍如何使用 Google Cloud 虚拟界面加载数据并运行查询以完成任务。

搭建谷歌云平台环境

1.打开谷歌云控制台

  1. 在 Google Cloud Console 中,选择 导航菜单 > BigQuery

  2. 登录以继续Google Cloud Platform

  3. Welcome to BigQuery in the Cloud Console 消息框会提示。如果您想了解更多信息,可以单击快速入门指南并列出 UI 更新

  4. 点击完成。

创建项目

您可以使用控制台、Google Cloud CLI 或zwz100029 projects.create() zwz100030 zwz100028方法创建新项目。请按照创建和管理项目文档中提到的步骤操作:https://cloud.google.com/resource-manager/docs/creating-managing-projects

加载公共数据集

签名后,您的环境已设置完毕,您可以加载公共数据集。

  1. 在左侧面板中,单击添加数据 > 固定项目

  2. 点击输入项目名称bigquery-public-data并点击**Pin。**这将授予您访问 Google Cloud BigQuery 中所有可用公共的权限(您还可以探索 other 可用数据集 **Explore public datasets 菜单) **

3、点击固定项目列表中的bigquery-public-data展开。

  1. 单击更多结果并向下滚动,直到看到 geo_us_roads

  2. 点击 geo_us_roads 展开数据集

打开本文探讨的table表格,点击all_roads_01,点击预览即可查看表格中的内容。

运行SQL查询

现在,让我们运行一个 SQL 查询来列出 road_id 和 road_geom 的前 100 个名称。单击“+”符号,将以下 SQL 查询写入查询编辑器,然后单击运行**。

您会注意到在窗口的右上角,查看查询验证器。当标记图标为绿色时,查询有效并且将运行。但是,当它为红色时,它会提供一个感叹号,指向错误。

结果显示了 road_id 和 road_geom 的 100 个名称,如下所示。查询结果部分提供 4 种不同的信息:

  • Job Information:提供您需要的所有信息,包括 Job ID、用户(Google 电子邮件)、位置、时间(创建、开始和结束)、持续时间、处理的数据量、运行成本、使用旧版 SQL 和目标表(临时存储表的位置)

  • 结果:显示结果表

  • JSON:以 JSON 格式提供结果

  • Execution Details:封装了经过的时间和查询处理的数据的详细信息。

您可以通过将查询结果导出到 BigQuery 表来保存查询结果,以便稍后进行评估。

Logo

华为、百度、京东云现已入驻,来创建你的专属开发者社区吧!

更多推荐