深度分析 DeepSeek‑V4 以混合注意力實現百萬標記上下文的代理人最佳化 DeepSeek於2026年推出V4模型,提供百萬標記上下文窗口,採用壓縮稀疏與重度壓縮注意力混合設計,顯著降低每步運算與KV快取需求。實測在長程代理任務中表現與商業閉源模型相當,預示開源大模型在應用上將更具競爭力。V4‑Pro以27%FLOPs與2%KV快取較提升,支援階段工具呼叫與思考。