Kaggle是最受欢迎的数据科学和机器学习社区之一。通过 Kaggle,人们可以参加比赛、学习新概念、共享笔记本、下载数据集等等。本文重点介绍通过使用 Kaggle API 命令行界面下载数据集的过程。以下说明的步骤基于官方文档并用作其中说明的过程的说明性示例。

第一步:安装Kaggle包

要访问 Kaggle api,必须通过 pip 安装 kaggle 包。假设系统上已经安装了 pip,运行命令pip install kaggle。图 1 显示了安装 kaggle 的示例和命令的输出。 install_kaggle.png图1:Kaggle安装

第二步:创建一个新的api token

转到您的帐户设置,然后单击 API 部分中显示“创建新 Api 令牌”的按钮,如图 2 所示。kaggle_api_token.png图2:Kaggle api Token按钮

创建新令牌将导致在本地系统上下载一个 json 文件。在 C:\Users<username>\ 目录中创建一个名为“.kaggle”的新文件夹,并将新的 json 文件移动到其中。

第三步:下载数据集

浏览现有数据集的方法有很多种,一个非常简单的方法是通过 kaggle网站搜索数据集。选择一个命令后,复制api命令如图3所示。copy_api_command.png图3:复制API命令按钮

复制命令后,如图 4 所示执行以下载数据集。 download_datasets.png图4:执行下载数据集的命令

结论

Kaggle API CLI 是一个强大的工具,可以用于很多任务。本文解释了如何使用它来下载数据集。欲了解更多信息,请访问官方 githubrepo和官方文档。

Logo

Python社区为您提供最前沿的新闻资讯和知识内容

更多推荐