Local LLaMA VRAM 預估器
快速估算執行 LLaMA 類模型所需的顯示記憶體
模型參數量 (B)
輸入模型的參數量,單位為十億 (B)
量化模式
請選擇量化模式
FP16
Q8
Q4
選擇模型的量化精度
上下文長度 (tokens)
輸入上下文長度,單位為 tokens
計算
重置
VRAM 需求估算結果
請輸入參數並點擊「計算」按鈕