在 BigQuery 中查询公共数据集
这个迷你分步指南涵盖以下内容: 设置谷歌云平台 在 BigQuery 中加载公共数据集 在 BigQuery 中运行 SQL 查询并将查询保存到 BigQuery 表中 图片:https://cloud.google.com/bigquery BigQuery 提供了巨大的存储容量来存储可以使用 SQL 查询轻松访问的海量数据集。作为一个包含 TB 和 PB 级数据的数据仓库,BigQuery 完
这个迷你分步指南涵盖以下内容:
-
设置谷歌云平台
-
在 BigQuery 中加载公共数据集
-
在 BigQuery 中运行 SQL 查询并将查询保存到 BigQuery 表中
图片:https://cloud.google.com/bigquery
BigQuery 提供了巨大的存储容量来存储可以使用 SQL 查询轻松访问的海量数据集。作为一个包含 TB 和 PB 级数据的数据仓库,BigQuery 完全由 Google 管理,可用于通过、Google Cloud Platform 控制台、BigQuery REST API调用或命令中的 Web UI 访问 BigQuery -线工具。
本文介绍如何使用 Google Cloud 虚拟界面加载数据并运行查询以完成任务。
搭建谷歌云平台环境
1.打开谷歌云控制台
-
在 Google Cloud Console 中,选择 导航菜单 > BigQuery
-
登录以继续Google Cloud Platform
-
Welcome to BigQuery in the Cloud Console 消息框会提示。如果您想了解更多信息,可以单击快速入门指南并列出 UI 更新
-
点击完成。
创建项目
您可以使用控制台、Google Cloud CLI 或zwz100029 projects.create() zwz100030 zwz100028
方法创建新项目。请按照创建和管理项目文档中提到的步骤操作:https://cloud.google.com/resource-manager/docs/creating-managing-projects
加载公共数据集
签名后,您的环境已设置完毕,您可以加载公共数据集。
-
在左侧面板中,单击添加数据 > 固定项目。
-
点击输入项目名称
bigquery-public-data
并点击**Pin。**这将授予您访问 Google Cloud BigQuery 中所有可用公共的权限(您还可以探索 other 可用数据集 **Explore public datasets 菜单) **
3、点击固定项目列表中的bigquery-public-data
展开。
-
单击更多结果并向下滚动,直到看到 geo_us_roads
-
点击 geo_us_roads 展开数据集
打开本文探讨的table表格,点击all_roads_01,点击预览即可查看表格中的内容。
运行SQL查询
现在,让我们运行一个 SQL 查询来列出 road_id 和 road_geom 的前 100 个名称。单击“+”符号,将以下 SQL 查询写入查询编辑器,然后单击运行**。
您会注意到在窗口的右上角,查看查询验证器。当标记图标为绿色时,查询有效并且将运行。但是,当它为红色时,它会提供一个感叹号,指向错误。
结果显示了 road_id 和 road_geom 的 100 个名称,如下所示。查询结果部分提供 4 种不同的信息:
-
Job Information:提供您需要的所有信息,包括 Job ID、用户(Google 电子邮件)、位置、时间(创建、开始和结束)、持续时间、处理的数据量、运行成本、使用旧版 SQL 和目标表(临时存储表的位置)
-
结果:显示结果表
-
JSON:以 JSON 格式提供结果
-
Execution Details:封装了经过的时间和查询处理的数据的详细信息。
您可以通过将查询结果导出到 BigQuery 表来保存查询结果,以便稍后进行评估。
更多推荐
所有评论(0)