深度分析
MISA(Mixture of Indexer Sparse Attention):以頭軸路由優化長上下文稀疏注意力
在大型語言模型處理百萬級上下文之際,密集注意力成為計算瓶頸。MISA(Mixture of Indexer Sparse Attention)提出把索引器的多個索引頭視為混合專家池,透過一個輕量的區塊匯總路由器,為每個查詢動態選取少數活躍頭部,只對這些頭進行逐詞評分,從而把每查詢的索引器成本從O(H^I·L)降到O(h·L+H^I·M)。
深度分析
在大型語言模型處理百萬級上下文之際,密集注意力成為計算瓶頸。MISA(Mixture of Indexer Sparse Attention)提出把索引器的多個索引頭視為混合專家池,透過一個輕量的區塊匯總路由器,為每個查詢動態選取少數活躍頭部,只對這些頭進行逐詞評分,從而把每查詢的索引器成本從O(H^I·L)降到O(h·L+H^I·M)。
大佬動態
Anthropic 在 2026 年 4 月推出 Claude Opus 4.7,聚焦高階軟體工程與長程推理。模型加入 extra‑high 等級,提升指令遵循與多模態支援,同時在 1M token 上下文窗口內保持穩定表現。此升級預示 AI 編碼與代理執行效能將進一步提升。
深度分析
研究指出長鏈推理時模型檢索能力會衰退,稱為思緒遺失。RecaLLM 交替執行推理與顯式上下文檢索,並使用受限解碼直接複製證據段落以提升根據性。實驗顯示在 RULER 與 HELMET 基準上取得顯著提升,且在 128K token 視窗下僅需 10K token 訓練樣本即可改善長上下文效能。