深度分析 DeepSeek V4:以 KV-cache 壓縮注意力與 CSA/MLA 重構企業推論成本 DeepSeek宣布將V4Pro永久降價並公開權重,引發企業雲端AI成本重估。核心採用交錯壓縮注意力(CSA與HCA)、多頭潛在注意力(MLA)、FP4量化訓練與mHC,顯著降低KV-cache與HBM需求。結果是高頻代理層成本大幅下探並可能改變供應鏈定價。