How to change huggingface transformers default cache directory

前言

最近在学习用TensorFlow框架做NLP任务,注意到huggingface中的transforms库非常强大,于是开始学习用它来做相应的任务。刚开始用这个库没多久,感觉确实操作起来既简单又强大,于是打算深入学习。

  • 学习过程中发现,运行程序过程中,下载的模型和数据集是默认放在C盘的用户目录下的,为了减轻C盘负担,于是想更改其默认目录,从官网了解到有两种实现方式,一种是临时指定cache_dir,另一种是直接设置环境变量,以下对二者进行说明。

关于windows上如何修改huggingface transformers默认缓存文件夹

  • 官方对缓存地址的说明:
     Cache setup第一种方式:设置环境变量:
    在windows上,为了以后使用方便,我采取了第一种设置缓存地址的方法,也就是设置TRANSFORMERS_CACHE环境变量,我将其设置在了用户环境变量里面:
    环境变量设置1接下来关键的一步:
    在用户环境变量Path或者系统环境变零PATH中添加:
    %TRANSFORMERS_CACHE%

第二种方式:在调用from_pretrained函数时使用cache_dir入参,指定缓存文件夹名
如指定缓存位置为当前目录:

AutoModel.from_pretrained('bert-base-chinese', cache_dir='./')

以上

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐