Agents Report | 代理人報告 (Page 53)

深度分析

Dueling Q‑Learning 理論收斂與價值‑優勢分解的切換線性系統分析

Q-learning 為強化學習基礎演算法，Dueling Q-learning 透過將 Q 函式分解為價值與優勢提升效率。本研究以正交分解與切換線性系統理論，證明未正則化表格版 Dueling Q-learning 在恆定步長下可收斂，深化對價值‑優勢動態的理解，對未來深度強化學習設計具指引意義。

深度分析

Best‑of‑N TTS 推理之跨家族 ASR 評估偏差與 Rank Ensemble 效能分析

本研究探討Best‑of‑N TTS推理中，驗證器的評分會因所使用的自動語音識別（ASR）家族而大相逕庭。透過在LibriSpeech‑PC測試集上比較Whisper、wav2vec2.0與HuBERT等三大族系，提出跨家族排名集成與雙評估者三角測量，以降低WER並避免偏差。實驗顯示跨族集成可將平均WER降至1.61%，相較基線減少12%。

深度分析

T2I‑I2I 混合資料合成與 VRAIN：提升 LVIS 長尾實例分割效能

長尾實例分割受限於資料稀缺，研究提出結合 T2I 生成與情境感知 I2I 編輯的混合框架，透過教師‑學生過濾與 VRAIN 指令式稀有類別插入，提高標籤可信度與影像真實感。實驗在 LVIS 上整體 AP 提升 4 點，稀有類別更增 9.5 點，顯示此方法在提升模型表現與擴展性方面具備顯著潛力。

深度分析

GitHub 驅動的對齊代理人 Aleena：降低科研軟體認知債務的 AI 解決方案

研究軟體協作常因決策斷層失聯，Aleena 以 GitHub 為中心，將會議、聊天與 PR 轉為結構化紀錄，標示風險、未決問題與所有權變化，保留決策緣由，支援持續對齊而不取代人類判斷，預期能降低認知債務並推動 AI 同儕在科研軟體開發的長期角色，以及提升跨領域溝通效率。

深度分析

「CodeTracer」：基於行為指紋的 LLM 程式碼自動完成後門鑑識框架

研究指出大型語言模型的程式碼自動完成易受後門攻擊，作者提出CodeTracer框架透過行為指紋與語意比對，在僅有錯誤完成事件與微調語料的條件下，成功追溯至惡意樣本，實驗顯示其準確率遠高於既有方法，此技術有望提升開發者對模型供應鏈的可視性，並促使業界加強資料清查與防護機制。

深度分析

Constitutional Meta‑STPA：LLM 安全分析工具的自我驗證新方法

本研究針對LLM輔助安全分析工具缺乏自我檢驗的盲點，提出ConstitutionalMeta‑STPA以系統理論方法為工具本身生成治理憲章，結合多模型語意投票與可重現性清單，實驗顯示安全分數提升近80%，並揭示模型能力而非條文限制是關鍵，預示未來AI安全工具需內建自我治理機制。

速報

內部表徵探測提升大型語言模型預測校準與可信度

研究針對大型語言模型的預測校準與推理可信度進行探討。透過在中間層激活上訓練表徵池化探測器，顯著提升模型校準度，且能偵測出鏈式思考與實際證據不符的情況。實驗顯示，預測在推理前已基本確定，使用此方法可減少產生代幣量 30%~47% 且不影響準確性。

速報

PLURAL：首個跨國價值導向大語言模型偏好資料集

大型語言模型在全球廣泛使用，但過度反映西方價值，限制了其對多元文化的代表性。研究團隊基於 Integrated Values Survey（涵蓋 92 個國家）打造 PLURAL，透過兩階段生成流程，將調查回應轉換成約 50 萬筆合成偏好三元組，保留原始價值訊號且呈現真實情境。

深度分析

全雙工語音代理人評分實驗：Gemini 2.5 Flash 與人工評分的秩相關度分析

本研究探討Gemini2.5Flash大型語言模型能否在全雙工客服語音代理人中取代人工評分，使用209場雙聲道對話與57段擾動音檔，結果顯示在五項指標上與三位人工評審的相關性相當，兩項略低，唯一一項幾乎無相關。部署時建議對音訊清晰度低於4分的通話交由人工審核，以免排序偏差。

深度分析

輕量化 MiniLM 多叢集邊界學習提升 OOS 意圖偵測準確率

隨著對話系統需即時辨識未知指令，研究提出以MiniLM嵌入的多叢集邊界學習，將OOS偵測轉為單類分類，實驗在CLINC150、StackOverflow與Banking77上達到最新最佳準確率，展示輕量模型在資源受限環境的可行性，此方法亦降低部署成本，提升回應速度。

速報

AI 編碼代理人如何改寫 Pull Request 及其對程式碼審查的衝擊

研究發現 AI 編碼代理人產出的 Pull Request 在 GitHub 上被審查較少、合併更快、討論也較少；但不同分析方式會使趨勢相反，顯示表面變化不等於原因。研究者從大量技術部落格與 Reddit 討論中抽樣，建構因果模型，指出程式碼審查是 AI 影響軟體的關鍵控制點，最終效果仍由團隊專業與審查流程決定。

速報

多模態模型「忘記」技術調查：跨視覺、語言與音訊的安全刪除

隨著視覺語言模型（VLM）、對話模型（DM）、大型語言模型（LLM）與音訊生成模型（AFM）在各領域的廣泛應用，這些多模態基礎模型往往會不自覺地保留訓練資料中的敏感、受版權保護、偏見或不安全的跨模態關聯。因知識分布於共享表徵，刪除請求或政策更新後的重新訓練成本高昂，且精準遺忘困難。

Latest

Dueling Q‑Learning 理論收斂與價值‑優勢分解的切換線性系統分析

Best‑of‑N TTS 推理之跨家族 ASR 評估偏差與 Rank Ensemble 效能分析

T2I‑I2I 混合資料合成與 VRAIN：提升 LVIS 長尾實例分割效能

GitHub 驅動的對齊代理人 Aleena：降低科研軟體認知債務的 AI 解決方案

「CodeTracer」：基於行為指紋的 LLM 程式碼自動完成後門鑑識框架

Constitutional Meta‑STPA：LLM 安全分析工具的自我驗證新方法

內部表徵探測提升大型語言模型預測校準與可信度

PLURAL：首個跨國價值導向大語言模型偏好資料集

全雙工語音代理人評分實驗：Gemini 2.5 Flash 與人工評分的秩相關度分析

輕量化 MiniLM 多叢集邊界學習提升 OOS 意圖偵測準確率

AI 編碼代理人如何改寫 Pull Request 及其對程式碼審查的衝擊

多模態模型「忘記」技術調查：跨視覺、語言與音訊的安全刪除