深度分析
Audio‑Side Time Prompt 與 TimePro‑RL:提升大型音訊語言模型的細粒度時間感知
大型音訊語言模型在時間感知上仍有挑戰。研究者以時間戳嵌入作為音訊側提示,並結合強化學習形成 TimePro‑RL 框架。實驗證實,此技術在音訊定位、聲事件偵測與密集說明等任務上顯著提升效能。
深度分析
大型音訊語言模型在時間感知上仍有挑戰。研究者以時間戳嵌入作為音訊側提示,並結合強化學習形成 TimePro‑RL 框架。實驗證實,此技術在音訊定位、聲事件偵測與密集說明等任務上顯著提升效能。
深度分析
針對 AI 代理人在複雜推理中面臨的獎勵稀疏挑戰,T-STAR 框架提出將推理路徑由「鏈」轉化為「樹」,透過認知樹結構與手術式策略優化,精確定位關鍵錯誤並修正推理行為,顯著提升 LLM 在多輪對話與長鏈推理任務中的表現。