深度分析 頻率濾波揭示模算術任務中過參數化模型的記憶與泛化共存機制 本研究以模算術(modular arithmetic)任務作為受控環境,探討過參數化神經網路如何在高比例標籤噪音下同時出現記憶(memorization)與泛化(generalization)行為。作者在二層網路上系統性變化寬度、激活函數、優化器與正則化,發現:增大模型在適當設定下仍有助於泛化;