潛在表示 - Agents Report

速報

研究指出，僅靠預訓練的in-context強化學習在部署分佈外時，回報與安全常難兼顧。提出潛在Q-Barrier盾牌：部署前學情境表示、潛在動態與成本評估器；部署時無參數更新，依歷史與剩餘預算過濾或軟性重權動作。五項基準實驗顯示，盾牌能改善部署期的回報與安全權衡。

深度分析

面對多物理科學訓練中常見的負轉移與梯度衝突，論文提出Shodh-MoE，一種結合物理約束潛在自編碼器與稀疏激活Transformer的架構。系統以Helmholtz式速度參數化強制流場守恆，將128^3物理場壓縮為16^3潛在token，並以Top‑1軟語義路由把局部潛片分配給專家子網路。

深度分析

在面對高維共變數與非線性結構的工具變數問題，BGM‑IV 以分割式貝式生成潛在空間來解耦混淆、處置與結果變異，並以工具變數誘導的處置分布進行準似然平均化以修正內生性。實驗顯示在高維場景下能顯著提升因果估計準確性，且在某些高維設定下優於既有方法。