set-valued-prediction - Agents Report

深度分析

開放式問答易出現幻覺，MiRD將整體未覆蓋風險拆為有限抽樣失敗與條件篩選失敗。先為抽樣失敗建立期望上界，再於抽樣成功時以全量校準集合校準篩選閾值，實驗顯示可同時控制兩類風險。對比傳統成功條件校準與PAC式界限，MiRD提供更緊的第一階段界限與更具適應性的預測集合。