Local LLaMA VRAM 預估器

快速估算執行 LLaMA 類模型所需的顯示記憶體

輸入模型的參數量,單位為十億 (B)
選擇模型的量化精度
輸入上下文長度,單位為 tokens

VRAM 需求估算結果

請輸入參數並點擊「計算」按鈕