Chaintrix:把LLM主張綁回結構化合約的智能合約審計框架
智能合約漏洞造成重大損失。團隊提出Chaintrix,要求所有LLM生成主張必須以結構化合約表示檢驗,並以Cross-ContractInteractionModel解析Solidity,用結構性檢查與符號執行分階段過濾誤報;在EVMbench上召回率為71.7%。
Chaintrix:以結構化表示約束LLM審計
智能合約漏洞頻繁造成重大損失,但人工審計成本高且耗時。Chaintrix將設計重點放在「每一項由大型語言模型提出的主張,皆須以確定性結構化合約表示來核驗」,藉此抑制LLM的幻覺型誤報並提升自動化結果的可檢證性。
系統首先採用Cross-Contract Interaction Model(CCIM),把Solidity解析成函式層級的讀寫、modifier與已解析的跨合約呼叫地圖。CCIM成為12個決定性信號引擎與並行LLM審計管線共同運作的基底,讓模型輸出能被結構化表示所對照。
合併後的發現會通過分階段的誤報降低流程,最終由結構化判決引擎(SVE)對解析後的程式碼施以確定性檢查;對於通過初步篩選且具有高可信度的項目,再以符號執行與模糊測試補強驗證。此流程兼顧自動化速度與分析嚴謹性。
在由OpenAI、Paradigm與OtterSec提供的EVMbench基準測試上,Chaintrix在120項高嚴重性漏洞中檢出86項,召回率為71.7%,且有25次審計達到100%召回,整體表現顯著優於最強的基線模型,顯示將LLM輸出與結構化合約表示綁定,能有效提升自動化審計的可靠度與實用性。
延伸閱讀
- FairQE:以多代理與 LLM 在推論期校正翻譯品質估計的性別偏誤
- 以語意監督為核心的 Text-to-SQL 合成方法:SemanticAgent 架構與實驗結果
- 可重用評估管線:為生成式人工智慧會議摘要建立標準化基準
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。