深度分析 詞彙聲學編碼(LAC):以詞彙化聲學特徵與語言表示進行可控音色傳輸 研究提出詞彙聲學編碼(LAC),讓預訓練大型語言模型在固定提示下,用可解讀的詞彙將聲音描述為英文句子,句子同時做為傳輸載體與重建依據。發送端把波形分析成可解釋的聲學描述並量化為詞彙標籤,接收端把句子解析回區間約束並以生成式解碼重建波形。實驗在短音效與符號音樂轉移上展示可測的聲學結構保留,以及可讀性與可編輯性的優勢。