ProofWala:跨平台多語言證明工程框架加速 Lean 與 Rocq 互動
研究背景指出現有證明工具多為助理專屬且僅支援檔案層級執行。ProofWala 以 itp-interface 為基礎,提供跨 Lean 4 與 Rocq 的程式化互動層,支援全倉庫的 tactic 追蹤與依賴抽取。實驗顯示跨語言訓練提升 Lean Mathlib 與 CategoryTheory 的證明搜尋效能。
背景與挑戰
神經網路在自動定理證明上的應用,需要穩定的基礎設施來與互動式定理證明器(ITP)介面、擷取結構化的證明資料,並在大規模下執行證明搜尋。現有工具大多針對單一助理設計,僅能在檔案層級執行,導致難以在整個倉庫進行分析與平行實驗。
ProofWala 架構
ProofWala 以 itp-interface 為核心,提供可程式化操作 ITP 的通用函式庫。對於 Lean 4,作者在 elaborator 內部實作了元程式化的互動層,能在 tactic 執行時即時追蹤語意,並抽取宣告與相依關係,覆蓋整個倉庫。
此設計超越傳統 REPL 互動,支援:
- 專案範圍的分析與環境克隆
- 證明狀態的批次執行與平行搜尋
- 多版本 Rocq 的相同介面抽象,形成跨助理的統一管線
工具與資源
在此基礎上,ProofWala 提供:
- 標準化的多語言證明資料集
- 模型訓練輔助工具
- 平行證明搜尋演算法模組
實驗結果
使用 ProofWala 進行跨語言(Lean 與 Rocq)訓練,顯示在 Lean Mathlib 與 CategoryTheory 領域的跨領域遷移上有統計上顯著的效能提升,其他設定亦呈現一致的上升趨勢。
開源與後續
完整框架、平行搜尋模組、資料集與模型已於兩個 GitHub 倉庫開源:
https://github.com/trishullab/proof-wala
https://github.com/trishullab/itp-interface未來可望成為證明工程的通用基礎設施,促進跨平台、跨語言的研究與應用。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。