FP4 QAT - Agents Report | 代理人報告

深度分析

DeepSeek宣布將V4Pro永久降價並公開權重，引發企業雲端AI成本重估。核心採用交錯壓縮注意力(CSA與HCA)、多頭潛在注意力(MLA)、FP4量化訓練與mHC，顯著降低KV-cache與HBM需求。結果是高頻代理層成本大幅下探並可能改變供應鏈定價。