深度分析 AI 代理審稿系統效能評估:OpenAIReview + GPT‑5.5 在品質與錯誤召回率的表現 隨著 AI 輔助論文激增,傳統審稿壓力上升,研究推出 OpenAIReview、‘coarse、Reviewer3 等代理審稿系統。測試顯示,最佳組合 OpenAIReview+GPT‑5.5 能在品質判斷上達 83% 正確率,錯誤偵測召回率 71.6%,且公開部署獲正向回饋。