kaggle API 命令下载数据集

发布时间 2023-05-31 18:17:02作者: wancy

1. kaggle介绍

  Kaggle(官网:https://www.kaggle.com/)是由Anthony Goldbloom和Ben Hamner于2010年创立的一个数据科学社区。它为数据科学家和机器学习工程师提供了一个平台,可以在该平台上进行数据分析和建模活动,同时进行竞赛式的数据分析等活动。Kaggle除了提供竞赛外,还有数据及代码分享,知识讨论,实时赛事和基于云端的notebooks等功能。Kaggle是一个非常重要的数据科学社区,它吸引了全球各地的数据科学家和机器学习实践者,为他们提供了分享与交流的平台,使得数据科学领域的研究变得更加便捷和快速。随着数据科学越来越火,Kaggle在业界的地位也水涨船高,并在2017年被谷歌收购。本文介绍kaggle API命令下载kaggle数据集。

2.kaggle安装

pip install kaggle -i https://pypi.douban.com/simple/ 

   安装完后,可以查看一下安装的情况。

3. 生成API秘钥

  在 Kaggle 的个人账户主页,选择“Account”→“Create new API Key”,这一步会下载一个 kaggle.json 文件。kaggle.json文件内容是username(注册的时候填的)key。注册一个kaggle账号或者使用其他账号(遇到的问题,自己想办法,我是通过手机弄好的)电脑如果不知道下载到哪里了,可以自己搜索出来,找到它。

 

4. 配置

  将下载的kaggle.json文件从下载目录复制到用户的.kaggle目录下。对于Windows用户来说,这个目录通常是C:\Users\User_Name\.kaggle;对于Linux或Mac用户来说,这个目录通常是/home/user_name/.kaggle。如果你之前没有使用过Kaggle API,则需要手动创建.kaggle文件夹。以下是我的配置。

5. 通过API命令下载数据集

   选择一个花的分类图片数据集(5类花,Lily,Lotus,Sunflower,Orchid,Tulip),点击Copy API command

  我的复制出来是这个: 

 kaggle datasets download -d kausthubkannan/5-flower-types-classification-dataset

 

 

  然后在cmd中输入该命令就可以下载了(图中显示了下载的路径了)。(下载速度很快)

  下载成功后,如下:

  如果想将数据集下载到自己想要的目录,可以如下(我没有试过):

  kaggle datasets download -d dataset_name -p /path/to/folder

  其中,/path/to/folder 是你想要将数据集下载到的文件夹的路径。

小结:关于kaggle注册过程中遇到的问题可以查阅相关网站解决。我是借助手机注册的。

  这里提供本文下载好的5类花数据集:

  链接:https://pan.baidu.com/s/1Jhq4MnpomThVXMxlArUpIg
  提取码:t15m

 

参考资料:

https://blog.csdn.net/m0_52510196/article/details/125495780

https://blog.csdn.net/iCloudEnd/article/details/127134077

https://blog.csdn.net/Marsbupt/article/details/124795050

https://zhuanlan.zhihu.com/p/266352908

  若存在错误或不足之处,欢迎指正与评论,能帮助你的话,请点个赞!