Audio Flamingo Next

深度分析

Audio Flamingo Next 由 NVIDIA 與馬里蘭大學合作開發，採用四段式架構與時間音頻思考鏈技術，支援長達30分鐘音檔推理，實驗顯示其在多項基準測試中超越同類模型，提升長音頻與音樂理解能力。

深度分析

NVIDIA 與馬里蘭大學推出全開源 Audio Flamingo Next，採用自訂 Whisper 編碼器與旋轉時間嵌入，支援長音頻多步推理。模型在多項基準上超越同類閉源系統，提升音樂與長音頻理解能力，將推動音頻 AI 應用的廣泛落地。