速報 - Agents Report | 代理人報告 (Page 13)

速報

大型時間序列預測模型的正規化策略對效能影響重大

大型時間序列預測模型近年成為處理多元訊號的熱門方法，通常採用因果自迴歸架構，逐筆預測未來值。然而，實務資料常出現非平穩性，正規化成為緩解此問題的關鍵手段。傳統正規化在因果設定下可能洩漏未來資訊，近期提出因果正規化與僅使用初始觀測統計的做法，但其實際效益尚未明朗。

速報

深度多代理強化學習在連續時間定價市場的兩大失效模式揭露

本研究在連續時間多代理強化學習（CT-MARL）基準中，觀察到兩種可重現的失效模式：競爭的DDPG代理間會暗中形成卡特爾，以及在高事件率下演員-評論家結構的不穩定。實驗顯示，同步的DDPG代理會產生顯著的共謀指數（Δ≈0.69），而引入非同步與觀測延遲可分別降低共謀程度至Δ≈0.28。

速報

KV 快取量化安全對齊崩潰與 Per-Channel Reduction 修復方案

研究針對大型語言模型的鍵值快取量化（KV cache quantization）進行安全性評估，發現低位元量化會在不顯著提升困惑度的情況下，大幅削弱模型的安全對齊。作者提出幾種失效模式，並開發 Per-Channel Reduction（PCR）診斷工具，能在不需再訓練的前提下，將失去的安全性恢復最高 97%。

速報

跨模態知識蒸餾新框架：無配對資料也能有效對齊特徵與標籤

研究提出一套跨模態知識蒸餾（CMKD）新框架，解決以往需配對多模態資料的限制。透過建立教師與學生模型之間的分布關係，核心聚焦於特徵對齊與標籤對齊兩大要素，讓蒸餾過程以分布而非單一樣本為基礎。理論上證明此方法具備有效性，實驗在多項多模態基準測試中，於有配對與無配對情境皆顯著優於既有技術，顯示出在資料取得成本高的情況下仍能提升小模型的表現。

速報

DeepSeek‑R1‑8B 搭配 LoRA 與 NEFTune 提升金融實體辨識效能

金融實體辨識因缺乏領域特化常出錯。研究以 DeepSeek‑R1‑8B 結合 LoRA 與 NEFTune 進行微調，將 1,693 句標註資料轉為指令式三元組，並於 Transformer 層加入輕量矩陣與噪聲嵌入。實驗結果顯示 micro‑F1 從 0.901 提升至 0.912，優於多款主流模型。

速報

DeepSeek‑R1‑8B 結合 LoRA 與 NEFTune 提升金融實體命名辨識效能

金融領域的實體命名辨識（NER）對於將非結構化的財報與新聞轉換為結構化知識圖譜至關重要。一般的大型語言模型常因缺乏金融專業知識而誤分類或忽略領域特徵。

速報

新世代生成式框架：大規模合成具標註的異常人類軌跡資料

研究人類軌跡異常對空間資料探勘至關重要，但缺乏帶標註的真實異常資料。原因在於異常事件本身稀有，加上取得大規模移動資料成本高且受隱私法規限制。為解決此困境，研究團隊提出端對端生成式框架，利用大型語言模型（LLM）在模擬基線軌跡上注入語意豐富的異常行為，例如不尋常的打卡或跳過例行拜訪，並以地圖限制的路徑重建確保空間合理性。

速報

商業世界模型 (BWM)：打造自動化目標導向的 AI 決策系統

隨著企業逐漸導入人工智慧工具以提升生產力與降低成本，單純的任務自動化已不足以發揮 AI 的全部潛能。本文提出「商業世界模型 (Business World Model, BWM)」的概念與架構，將世界模型的概念延伸至企業與組織環境。

速報

INFUSER：自我演化的迭代共訓練框架提升大型語言模型推理能力

研究提出 INFUSER，一種結合生成器與求解器的迭代共訓練機制，讓預訓練語言模型在僅需最小外部監督下自行提升推理表現。生成器從自動收集的非結構化文件中草擬問題與參考答案，求解器則以標準正確性獎勵訓練，生成器則根據能否提升求解器的影響分數獲得獎勵。

速報

AI 助力雙階段現代化：NMAP‑RKPM 由 Fortran 單執行緒升級至 OpenMP 並行 C++

為因應計算資源快速變化，研究團隊以 AI 輔助雙階段將 NMAP‑RKPM 從 Fortran 單執行緒 MPI 轉為 OpenMP 並行 C++ MPI。透過手把手的代理流程，提供範例、持續建置檢查與會話限制，克服大型語言模型的限制。最終在數月內完成轉換，提升程式效能與可維護性。

速報

AI 程式碼沙箱安全比較：引擎層面六項指標大揭密

本研究同時測量六項引擎層面的安全指標：主機攻擊面、資訊洩漏、深度防禦堆疊、公開 CVE 歷史、修補節奏與上游 fuzzing 狀況，評估五種 AI 沙箱產品如何將客戶程式碼與主機核心隔離。結果顯示，微型虛擬機、使用者空間核心與 OCI 容器在所有指標上均有明顯分野，但同類別產品間差異不大；

速報

大型語言模型展現說服力：模仿人類溝通意圖的實驗結果

研究以哈貝馬斯的交際行動理論為框架，探討大型語言模型（LLM）在說服性對話中的表現。透過模擬 Reddit ChangeMyView 子版的討論，將人類與 LLM 產出的反論文比較，聚焦於語言的行為意圖（如傳遞知識、建立信任、顯示相似性）是否能與人類相匹配。