速報 指令向量導向大規模音頻語言模型:提升時間注意力與事件定位 研究者提出「指令向量導向」技術,透過比較不同指令提示下的模型激活,於固定音訊中生成導向向量,顯著改變大型音頻語言模型(LALM)的時間注意力分布,使其聚焦於聲音相關區段。