LLM 裁判 - Agents Report | 代理人報告

深度分析

針對大型語言模型作裁判在公開難題基準上準確率接近隨機的狀況，研究提出RTLC三階段提示法：研究、教學式學習與批判。流程先要求模型以教學方式重述題目並找出自我說明的缺口，接著產生十個獨立候選裁決，最後由同一模型逐一批判比較後輸出最終判定。實驗證明在不微調或外部工具下，可明顯提升單模型的對判準確度。