深度分析 Khala:以64層殘差向量量化深度聲學代幣推進高保真音樂生成 高品質音樂生成常把結構與音質拆分處理。Khala以單一64層殘差向量量化深度聲學代幣層級,採兩階段由粗至細生成,全曲尺度平行超解析並以混合注意力強化歌詞對齊。人類盲聽評比顯示Khala在開源系統名列前茅,證明純聲學代幣路線具備實務競爭力。且可望進一步擴展。