深度分析 在 LDM 中以自注意力替換實現免訓練音樂風格轉換 研究提出一種免訓練的音樂風格轉換方法,利用已有的潛式擴散模型(LDM)在梅爾頻譜上操作自注意力特徵,將參考曲風的 key/value 注入到內容曲的解碼器後段。方法結合 DDIM 反演取得潛向量與注意力特徵,並輔以 query 保留、注意力溫度調整與初始潛態 AdaIN,達到在不微調模型下仍能保留旋律結構且改變音色與局部紋理的效果。