深度分析 Prompt‑Aware Online Evaluation Scheduling:具子模組保證的提示感知評估排程 自動提示優化需大量評估成本,研究提出 POES 以 IRT 辨識效用、覆蓋項與切換成本為目標,形成子模組保證。實驗顯示在相同預算下提升 6.2% 準確度,且以 20 樣本即可匹配 30‑50 樣本的效果,顯著降低 token 消耗。