下面是一套 「Windows + NVIDIA GPU」目前最穩定、最少踩雷的 IndexTTS-2 安裝流程。
目標是:先穩定跑起來,再追求加速(避免一開始就被 CUDA / DeepSpeed 搞爆)。
一、系統前置(只要做一次)
1️⃣ NVIDIA 驅動
- 請安裝 最新版 NVIDIA 顯示卡驅動
- 安裝完成後重開機
驗證(PowerShell):
nvidia-smi
能看到 GPU 資訊就 OK。
2️⃣ Python(建議 3.10 或 3.11)
到官網安裝:
安裝時請勾選:
驗證:
python --version
3️⃣ Git + Git LFS
驗證:
git --version
git lfs version
初始化 LFS(只需一次):
git lfs install
二、下載專案(含大檔)
git clone https://github.com/index-tts/index-tts.git
cd index-tts
git lfs pull
完成後你應該能看到:
index-tts\
├─ checkpoints\
├─ indextts\
├─ webui.py
└─ pyproject.toml
三、安裝 uv(官方唯一支援)
python -m pip install -U uv
驗證:
uv --version
四、建立環境(⚠️ 不裝 DeepSpeed,最穩)
✅ 建議指令(Windows 首選)
uv sync --extra webui
❌ 不建議一開始用
uv sync --all-extras
原因:
- DeepSpeed 在 Windows 極容易編譯失敗
- 不是必須,先跑起來比較重要
五、下載 IndexTTS-2 模型(官方)
1️⃣ 安裝 HuggingFace CLI(用 uv)
uv tool install "huggingface-hub[cli,hf_xet]"
若提示 PATH,請照 uv 的訊息重開 PowerShell
2️⃣ 下載模型到 checkpoints
hf download IndexTeam/IndexTTS-2 --local-dir checkpoints
下載完成後:
checkpoints\
├─ config.yaml
├─ *.safetensors
└─ ...
六、(可選)檢查 GPU 是否可用
uv run tools/gpu_check.py
正常狀況你會看到:
- CUDA available: True
- GPU 名稱(你的顯卡)
七、啟動 WebUI(穩定設定)
uv run webui.py
瀏覽器開:
http://127.0.0.1:7860
八、WebUI 建議設定(第一次)
進 WebUI 後建議:
- ✅ FP16(Half Precision):開
→ 省 VRAM、速度更快
- ❌ DeepSpeed:先不要
- ❌ CUDA kernel compile:先不要
等你確定「能穩定生成語音」後,再來試加速選項。
常見 Windows 踩雷總表
❌ 問題:卡在 torch / CUDA
解法:
uv sync --extra webui
❌ 問題:DeepSpeed 安裝失敗
解法:
❌ 問題:啟動很慢、VRAM 不夠
解法:
- 開 FP16
- 換短一點的文字測試
- 8GB VRAM 勉強可跑,12GB+ 體驗會好很多
最終確認(你只需要記住這 3 行)
cd index-tts
uv sync --extra webui
uv run webui.py