深度分析
BBCritic 與 BBBench:以對比學習與度量學習重構 GUI 評分器
在以測試時計算檢索(Test-Time Scaling, TTS)為核心的通用 GUI 代理中,評分器(Critic)成為整體決策品質的瓶頸。論文提出 BBCritic,基於「功能等價」假說,採兩階段對比學習,將使用者指令與候選動作投射到共享的可供性(affordance)空間,回復動作有效性的階層結構並實現連續分數。
深度分析
在以測試時計算檢索(Test-Time Scaling, TTS)為核心的通用 GUI 代理中,評分器(Critic)成為整體決策品質的瓶頸。論文提出 BBCritic,基於「功能等價」假說,採兩階段對比學習,將使用者指令與候選動作投射到共享的可供性(affordance)空間,回復動作有效性的階層結構並實現連續分數。
深度分析
研究聚焦於深度模型的表示學習,提出 Soft Silhouette Loss 以批次全局結構取代僅靠配對關係,鼓勵樣本靠近同類而遠離他類。實驗證實此損失與交叉熵結合可提升 Top‑1 準確率,且計算開銷較低,顯示全局叢集原則在深度學習中的可行性。