Local LLaMA VRAM 預估器

快速估算執行 LLaMA 類模型所需的顯示記憶體

模型參數量 (B) 輸入模型的參數量，單位為十億 (B)

量化模式選擇模型的量化精度

上下文長度 (tokens) 輸入上下文長度，單位為 tokens

VRAM 需求估算結果

請輸入參數並點擊「計算」按鈕

© 2025 阿中小站