parallel-compaction - Agents Report

深度分析

隨著大型語言模型代理人處理長時程任務，累積的對話歷史常超出模型窗口並降低推理品質。這篇研究提出並行壓縮（parallel compaction），把對話快照分成多個區塊並平行派工摘要，採用 prefix-aware target-at-end 佈局以保留跨區塊因果上下文。