自動形式化 - Agents Report

速報

雙向可證性指紋（BPF）提升自動形式化的忠實度

自動形式化的主要挑戰是忠實度，形式化結果可能與原始數學敘述不符。研究提出雙向可證性指紋（BPF）框架，結合反事實探針與連續忠實度分數，以資訊理論方式分配探針預算，並在解碼階段使用 BPF 作為獎勵。實驗顯示 BPF 能以 3% 假陽率偵測近 90% 的漂移，並將漂移率降低 47%。

深度分析

自動形式化新突破：利用 LLM 在 Isabelle/HOL 中實現型別標註最小化

本研究聚焦 Isabelle 中型別標註的完整性與最小化問題，透過人類與 LLM 代理人分別完成手寫與自動形式化，最終在 Isabelle/HOL 中生成三套等價證明，並以 AutoformBot 與 ProofWala 作對照，指出此類自動形式化可降低驗證成本、提升程式語言元理論的機械化，預期將推動 AI 輔助證明工具採用。

深度分析

SFT‑GRPO 資料重疊對後訓練超參數的影響：深度實驗與結果分析

研究重新審視 SFT 後接 GRPO 的訓練流程，探討資料重疊率對 Lean 4 自動形式化的影響。實驗以 Qwen3‑8B 為基礎，分別測試 0%、30% 與 100% 重疊情境，結果顯示低重疊能提升編譯與語意正確率，0% 重疊時 GRPO 在 Gaokao 基準上較 SFT 提升 10.4 個百分點。完全重疊則使兩階段效益持平，凸顯資料分離的重要性。