深度分析 位元受限優化與高斯均值估計的資訊理論下界分析 隨著低位元梯度訓練在大型語言模型中成為主流,研究者探討在B位元量化的隨機一階預言機下,優化問題可等價於壓縮高斯均值估計,證明T·B=Ω(d)與T=Ω(σ²d/ε²)的資訊理論下界,並在八個POMDP環境驗證相變現象,顯示傳輸率可降低至傳統上限的1/19,為未來AI系統的位元效率提供基礎。