Compressed Convolutional Attention (CCA) - Agents Report

深度分析

Zyphra發表ZAYA1-8B，一款以推理為核心的MoE模型；採用MoE++、壓縮捲積注意力與MLP路由器，並在預訓練導入長CoT與answer-preserving trimming；測試時計算Markovian RSA提升數學與程式推理表現，且在AMD GPU堆疊上完成訓練與部署驗證。