速報
潛在 Q-Barrier 盾牌:為安全 in-context 強化學習加上行動層安全濾網
研究指出,僅靠預訓練的in-context強化學習在部署分佈外時,回報與安全常難兼顧。提出潛在Q-Barrier盾牌:部署前學情境表示、潛在動態與成本評估器;部署時無參數更新,依歷史與剩餘預算過濾或軟性重權動作。五項基準實驗顯示,盾牌能改善部署期的回報與安全權衡。
速報
研究指出,僅靠預訓練的in-context強化學習在部署分佈外時,回報與安全常難兼顧。提出潛在Q-Barrier盾牌:部署前學情境表示、潛在動態與成本評估器;部署時無參數更新,依歷史與剩餘預算過濾或軟性重權動作。五項基準實驗顯示,盾牌能改善部署期的回報與安全權衡。
深度分析
面對多物理科學訓練中常見的負轉移與梯度衝突,論文提出Shodh-MoE,一種結合物理約束潛在自編碼器與稀疏激活Transformer的架構。系統以Helmholtz式速度參數化強制流場守恆,將128^3物理場壓縮為16^3潛在token,並以Top‑1軟語義路由把局部潛片分配給專家子網路。
深度分析
在面對高維共變數與非線性結構的工具變數問題,BGM‑IV 以分割式貝式生成潛在空間來解耦混淆、處置與結果變異,並以工具變數誘導的處置分布進行準似然平均化以修正內生性。實驗顯示在高維場景下能顯著提升因果估計準確性,且在某些高維設定下優於既有方法。