深度分析
評估 LLM 在加護病房的決策支援:RealICU 資料集與 ICU‑Evo 結構化記憶實作
重症加護病房資料量大且動態,RealICU以事後資深醫師審閱全程軌跡標注,評估病人狀態、急性問題、建議處置與危險操作四項能力。研究指出結構化記憶的ICU‑Evo可改善長時程推理,但仍面臨召回與安全的取捨及錨定偏誤。實驗揭示模型在真實ICU環境下仍不可靠,適合用作臨床安全檢測平台。
深度分析
重症加護病房資料量大且動態,RealICU以事後資深醫師審閱全程軌跡標注,評估病人狀態、急性問題、建議處置與危險操作四項能力。研究指出結構化記憶的ICU‑Evo可改善長時程推理,但仍面臨召回與安全的取捨及錨定偏誤。實驗揭示模型在真實ICU環境下仍不可靠,適合用作臨床安全檢測平台。
深度分析
隨著多模態大型語言模型推進 GUI 自動化,長程任務受限於上下文過載與冗餘模組。MGA 以觀察先行與結構化記憶分離決策步驟,取代原始歷史聚合,降低認知負擔。實驗顯示其在 OSWorld 等開放式任務中保持高效表現,為下一代 GUI 代理提供可擴展路徑。