推薦系統
平衡溝通與搜尋成本:後驗抽樣與傾斜抽樣在 AI 推薦系統的最佳化
本文建立一個資訊論化的理論框架,研究使用者與 AI 推薦助理在高維產品空間中的互動設計。使用者透過有成本且有噪音的訊息傳達偏好,AI 根據此訊息以貝氏後驗或經過優化傾斜的取樣分布產生推薦清單,清單大小可調以平衡包含高效用商品的機率與使用者的搜尋成本。
推薦系統
本文建立一個資訊論化的理論框架,研究使用者與 AI 推薦助理在高維產品空間中的互動設計。使用者透過有成本且有噪音的訊息傳達偏好,AI 根據此訊息以貝氏後驗或經過優化傾斜的取樣分布產生推薦清單,清單大小可調以平衡包含高效用商品的機率與使用者的搜尋成本。
深度分析
本文在二間旅館的定價模擬中揭示一種常被忽視的失效模式:單一數值回報(例如 RevPAR)可能掩蓋非市場化的定價行為。研究指出,部分觀測下的競爭者狀態會把目標行為變成分布式標的,確定性值函數或單點複製會把未解的隱含不確定性壓縮成捷徑行為。
深度分析
隨著大型語言模型向邊緣裝置擴散,計算與記憶體受限成為瓶頸。研究者提出以 KL 散度為基礎的前向感度分析,快速找出混合式 SSM‑Transformer 中最易受量化影響的元件。實驗顯示,KL‑導向的混合精度配置在 Intel Luna Lake 上可達接近 FP16 的困惑度,同時維持與統一 INT4 相當的模型大小與吞吐量。
深度分析
研究探討KL散度在高斯擾動下的穩定性,提出任意分佈與高斯族的銳利上界;證明√ε收斂率最佳;此結果擴展非高斯情境的KL推理,對流式模型的OOD分析具實務意義。