強化學習 - Agents Report

深度分析

情感分析模型常缺乏可解釋性。ABSA‑R1 透過強化學習產生推理文本，並以認知對齊獎勵模型確保推理與標籤一致，同時使用拒絕抽樣聚焦不確定案例。實驗證明此方法提升解釋性與分類效能，對 AI 可解釋性具正向衝擊。