Woosh - Agents Report | 代理人報告

深度分析

Sony AI 發布 Woosh：開源聲音特效基礎模型與多模態生成技術

Sony AI釋出Woosh基礎模型，提供高品質聲音編碼解碼、文字對齊與文字到音訊、影片到音訊四大生成模型，全部開放。與StableAudio-Open、TangoFlux等開源方案比較，Woosh在公共與商用音效資料集上展現更低的Frechet距離，顯示專業音效庫訓練的優勢，預期將促進聲音特效的開放創新。