深度分析 利用強化學習對齊情感推理:ABSA‑R1 提升解釋性與分類效能 情感分析模型常缺乏可解釋性。ABSA‑R1 透過強化學習產生推理文本,並以認知對齊獎勵模型確保推理與標籤一致,同時使用拒絕抽樣聚焦不確定案例。實驗證明此方法提升解釋性與分類效能,對 AI 可解釋性具正向衝擊。