在 Hugging Face 平台下載模型或資料集時,系統會自動將檔案快取(cache)在本機硬碟,讓下次載入更快速。不過隨著使用,快取資料夾會愈來愈大,占用寶貴的儲存空間。因此,學會安裝 Hugging Face 工具與正確管理、清理快取的方法十分重要。本文將從安裝到快取管理,一步步完整教學。
1. 安裝 Python 與 Hugging Face hub 套件
步驟一:安裝 Python
- 前往 Python 官方網站 下載適用的安裝程式。
- 安裝過程中,務必勾選「Add Python to PATH」,確保日後可以直接在命令提示字元使用
python
指令。
步驟二:確認 pip 是否可用
通常安裝 Python 就會自帶 pip,可以在命令提示字元(CMD)輸入:
pip --version
若顯示版本號即代表已安裝。
步驟三:安裝 Hugging Face hub 工具
在命令提示字元執行:
pip install huggingface_hub
2. Hugging Face 快取資料夾預設位置
Hugging Face 下載的模型與資料集,預設會快取在:
C:\Users\你的使用者名稱\.cache\huggingface\
你可以直接用檔案總管前往這個路徑,查看或手動管理快取內容。
3. 使用 Hugging Face CLI 掃描快取
安裝好 Hugging Face hub 後,可用以下指令掃描目前快取使用狀況:
huggingface-cli scan-cache
輸出範例:
REPO ID REPO TYPE SIZE ON DISK NB FILES LAST_ACCESSED ...
------------- --------- ------------ -------- ------------- ...
openai/clip... model 1.7G 12 22 hours ago ...
...
Scanned 14 repo(s) for a total of 17.1G.
這樣就能一目了然有哪些模型快取、各自占用多少空間及最後使用時間。
4. 清理 Hugging Face 快取
方法一:互動式全部清除快取(推薦)
Hugging Face CLI 可用 delete-cache --disable-tui
進行清除:
huggingface-cli delete-cache --disable-tui
執行後會產生一個暫存文字檔,請根據說明把你要刪除的快取 revision 前面的 #
拿掉,儲存後回到命令提示字元,輸入 y
確認刪除即可。如果全部都拿掉 #
,就是全部刪除。
方法二:手動刪除特定快取資料夾
根據 scan-cache
顯示的「LOCAL PATH」,直接用檔案總管進入該路徑,刪除不需要的快取資料夾。例如:
C:\Users\你的使用者名稱\.cache\huggingface\hub\models--openai--clip-vit-large-patch14
這樣只會影響該模型的快取,其他不會受影響。
方法三:自動刪除一年未用的快取(Python 腳本)
將以下腳本存成 clean_hf_cache.py
,然後在命令提示字元執行 python clean_hf_cache.py
:
import os
import shutil
import time
# 設定 Hugging Face 快取主目錄
cache_dir = os.path.expanduser(r"~\.cache\huggingface\hub")
one_year_seconds = 365 * 24 * 60 * 60
now = time.time()
deleted = 0
for folder in os.listdir(cache_dir):
folder_path = os.path.join(cache_dir, folder)
if os.path.isdir(folder_path):
last_access = os.path.getatime(folder_path)
if now - last_access > one_year_seconds:
print(f"刪除 {folder_path}(超過一年未使用)")
shutil.rmtree(folder_path)
deleted += 1
print(f"共刪除 {deleted} 個超過一年未用的快取資料夾")
這段腳本會自動刪除所有超過一年未存取的 Hugging Face 快取資料夾,讓硬碟空間維持乾淨。
5. 常見問答
Q1. Hugging Face 快取會自動清理嗎?
不會,快取預設永久保存,需自行清理。
Q2. 清理快取有什麼影響?
下次載入同一個模型或資料集時會重新下載,不會影響原本程式或資料內容。
Q3. 可以定期自動清理快取嗎?
可以,把上述 Python 腳本設定在 Windows 工作排程器,定期執行即可。
6. 小結
- 安裝 Hugging Face hub:
pip install huggingface_hub
- 掃描快取狀態:
huggingface-cli scan-cache
- 清理快取:
huggingface-cli delete-cache --disable-tui
或手動刪除
- 進階自動化:自訂 Python 腳本定期自動清理
善用這些工具,就能讓 Hugging Face 快取不再爆量,保持系統儲存空間清爽!