3.1 什麼是量化?
量化是一種模型壓縮技術,透過減少模型參數的位數(bit)來降低模型的儲存和計算需求。這類似於壓縮文件,使其更小、更易於傳輸和儲存。
3.2 Q5 和 Q6 的簡單解釋
- Q5:使用 5 位 來表示每個數字,能表示 32 種(2⁵ = 32) 不同的數字。這意味著模型佔用的空間更少,但精確度略低。
- Q6:使用 6 位 來表示每個數字,能表示 64 種(2⁶ = 64) 不同的數字。相比 Q5,Q6 提供了更高的精確度,但佔用的空間稍多。
3.3 Qn 的影響
Qn 中的 n 表示用來表示數字的位數,n 越大,表示數字的精確度越高,模型的表現也越準確。然而,位數越多,模型佔用的儲存空間和計算資源也越多。