深度分析 ResBM:低頻寬管線平行的殘差瓶頸模型與 128 倍激活壓縮實驗 為解決大型分散式訓練在管線平行上對高頻寬的依賴,研究提出 Residual Bottleneck Model(ResBM),在管線邊界加入殘差編碼器‑解碼器瓶頸模組,保留低秩身份路徑以支援低頻寬通訊。實驗顯示 ResBM 能達到 128 倍激活壓縮,且收斂速度與資源開銷與傳統方法相當,提升了低頻寬環境下的訓練效能。