Probabilistic Language Tries
從運算轉向檢索:Probabilistic Language Tries (PLTs) 如何將 LLM 推理複雜度降至 O(log N)
研究人員提出 Probabilistic Language Tries (PLTs) 框架,將生成式模型的前綴結構顯式化。透過機率分佈,PLTs 能將 Transformer 推理成本從 O(n^2) 降低至 O(log N) 級別,同時提供高效的無損壓縮與決策策略表示,為 AI 推理加速與資源優化// 提供了新路徑。