深度分析 MiniMax公開M2技術報告:揭示M3採用 MiniMax Sparse Attention(MSA)以加速百萬-token 解碼 MiniMax發表深度技術報告,回顧M2系列(含M2、M2.5、M2.7)在稀疏Mixture-of-Experts、Grouped Query Attention(GQA)與工程化路徑上的關鍵取捨;