深度分析 RTLC:以 Teach-to-Learn 與自我批判提高 LLM 作為裁判的準確度 針對大型語言模型作裁判在公開難題基準上準確率接近隨機的狀況,研究提出RTLC三階段提示法:研究、教學式學習與批判。流程先要求模型以教學方式重述題目並找出自我說明的缺口,接著產生十個獨立候選裁決,最後由同一模型逐一批判比較後輸出最終判定。實驗證明在不微調或外部工具下,可明顯提升單模型的對判準確度。