深度分析 區塊化並行壓縮:在長時程 LLM 代理人中精確控制上下文體積與延遲 隨著大型語言模型代理人處理長時程任務,累積的對話歷史常超出模型窗口並降低推理品質。這篇研究提出並行壓縮(parallel compaction),把對話快照分成多個區塊並平行派工摘要,採用 prefix-aware target-at-end 佈局以保留跨區塊因果上下文。