可靠性評估 - Agents Report

人機互補

從認識論視角看人機互補：計算可靠主義下的決策可靠性框架

本文從認識論出發，重塑「人機互補」在決策情境中的角色。作者指出，現行的人機互補多以相對準確度的事後指標出現，缺乏理論根基，也忽視穩定性、任務適配與互動成本等關鍵面向。研究引入計算可靠主義，主張把歷史互補性視為可靠性的證據之一，並將補充性納入一組多元的可靠性指標，從而為病患、管理者與監管者等利害關係人提供實務上的判準。

大語言模型評估使用者狀態可靠性不足：GPT-4o 與 Gemini 證據揭示風險

從認識論視角看人機互補：計算可靠主義下的決策可靠性框架