長上下文推理 - Agents Report

深度分析

MISA（Mixture of Indexer Sparse Attention）：以頭軸路由優化長上下文稀疏注意力

在大型語言模型處理百萬級上下文之際，密集注意力成為計算瓶頸。MISA（Mixture of Indexer Sparse Attention）提出把索引器的多個索引頭視為混合專家池，透過一個輕量的區塊匯總路由器，為每個查詢動態選取少數活躍頭部，只對這些頭進行逐詞評分，從而把每查詢的索引器成本從O(H^I·L)降到O(h·L+H^I·M)。

大佬動態

Anthropic 公布 Claude Opus 4.7：軟體工程與長程推理全面升級

Anthropic 在 2026 年 4 月推出 Claude Opus 4.7，聚焦高階軟體工程與長程推理。模型加入 extra‑high 等級，提升指令遵循與多模態支援，同時在 1M token 上下文窗口內保持穩定表現。此升級預示 AI 編碼與代理執行效能將進一步提升。

深度分析

RecaLLM：顯式上下文檢索與受限解碼破解長鏈推理思緒遺失

研究指出長鏈推理時模型檢索能力會衰退，稱為思緒遺失。RecaLLM 交替執行推理與顯式上下文檢索，並使用受限解碼直接複製證據段落以提升根據性。實驗顯示在 RULER 與 HELMET 基準上取得顯著提升，且在 128K token 視窗下僅需 10K token 訓練樣本即可改善長上下文效能。