深度分析 Sony AI 發布 Woosh:開源聲音特效基礎模型與多模態生成技術 Sony AI釋出Woosh基礎模型,提供高品質聲音編碼解碼、文字對齊與文字到音訊、影片到音訊四大生成模型,全部開放。與StableAudio-Open、TangoFlux等開源方案比較,Woosh在公共與商用音效資料集上展現更低的Frechet距離,顯示專業音效庫訓練的優勢,預期將促進聲音特效的開放創新。