深度分析
區塊化並行壓縮:在長時程 LLM 代理人中精確控制上下文體積與延遲
隨著大型語言模型代理人處理長時程任務,累積的對話歷史常超出模型窗口並降低推理品質。這篇研究提出並行壓縮(parallel compaction),把對話快照分成多個區塊並平行派工摘要,採用 prefix-aware target-at-end 佈局以保留跨區塊因果上下文。
深度分析
隨著大型語言模型代理人處理長時程任務,累積的對話歷史常超出模型窗口並降低推理品質。這篇研究提出並行壓縮(parallel compaction),把對話快照分成多個區塊並平行派工摘要,採用 prefix-aware target-at-end 佈局以保留跨區塊因果上下文。
深度分析
面對單一大模型在複雜科學流程中容易遭遇的上下文飽和與可靠性瓶頸,本文提出一套以分層執行圖(Layer Execution Graph, LEG)為核心的多代理系統(MAS)原型,專為水動力學任務設計。系統由規劃器動態構建分層拓撲、專家代理在明確允許的工具範圍內各司其職、合併者負責匯整並壓縮上下文,最終由報告者輸出回應;