Agents Report | 代理人報告 (Page 36)

深度分析

無分布假設下的半監督學習：線性風險組合與變異最小化

半監督學習因標記成本高而受矚目，但多數方法依賴資料分布假設，如流形或叢集假設，若假設不成立會導致效能下降。本文提出一套通用的風險重寫框架，透過線性組合各類風險構建無偏估計子，既涵蓋既有的 PNU 方法，也自然延伸至多類別情境，並在一般與非對稱損失下推導出可達到的最小變異下界，證明在不對稱損失時可優於 PNU。

深度分析

從 Query‑Aware 到 Query‑Agnostic：KV 快取壓縮方法的全面審計與排名

本研究針對 KV 快取壓縮在查詢可見性不同下的表現進行配額匹配審計，發現只有 KeyDiff 在查詢無關情境仍優於三種平凡基線；SnapKV 在加入問題後才顯著提升。結果顯示查詢感知分數掺雜了問題相關性，對部署成本與評估可靠性產生影響。此外，審計揭露注意力後端混淆與基準長度依賴等兩項可重現的評估風險。

速報

DoYouRemember：將重建記憶引入多模態大模型的全新架構

研究指出人類記憶是重建而非完整紀錄，現有多模態大模型在處理影像後會遺失內部表徵。作者提出 DoYouRemember 三階段架構：先以 VQ‑VAE 將影像壓縮成離散視覺代幣，再以 LoRA 微調的大模型同時注意視覺與文字代幣，最後用擴散解碼器從大模型隱藏狀態重建影像。

An infographic of BuSNN architecture combining burst-enhanced neurons and dynamic weight constraints for robust SNNs.

深度分析

BuSNN：透過多脈衝神經元與動態權重提升 SNN 的準確率與抗擾能力

隨著脈衝神經網路（SNN）在視覺任務上逼近人工神經網路（ANN）的表現，研究聚焦於提升其在輸入擾動下的穩定性。本文提出結合爆發式脈衝神經元（BSN）與動態權重約束（DWC）的BuSNN，藉由多脈衝發放與權重自適應懲罰降低激活與權重變化。實驗顯示在CIFAR-10與ImageNet上，BuSNN分別提升3.18%與2.66%的top‑1準確率與魯棒性，且能以低於ANN四倍的能耗運作。

速報

Human‑Inspired GNP (HGNP)：以兒童發展啟發的自適應圖形演化框架

近年代理式人工智慧逐漸採用圖形方法以提升可解釋性與非線性推理，基因網路程式設計（GNP）因需在探索與利用間取得平衡而面臨挑戰。研究以兒童成長時期的「廣泛實驗」與「後期深思」模式作為靈感，將 GNP 判斷節點映射為深思節點、處理節點映射為行動節點，提出 Human‑Inspired GNP（HGNP）框架。

深度分析

大規模即時語言模型 (Point‑in‑Time LLM) 以 FineWeb 資料提升至 4 B 參數的效能突破

隨著大型語言模型在金融與社會科學的應用日增，未限制時間的訓練資料會產生前視偏誤。研究者以月為單位切割，將模型擴至40億參數、使用1兆時間序列過濾的網頁文字，並以LoRA微調。結果顯示，即時模型在常識推理與語意理解上接近Gemma‑3‑4B與LLaMA‑7B，且在資產定價測試中具顯著預測能力。

速報

AI 搜尋衝擊傳統搜尋：ChatGPT 只產生 5.2% 外部點擊

研究利用美國桌面點擊串流比對 ChatGPT 與 Google 的資訊搜尋行為。ChatGPT 只在 5.2% 會話產生外部點擊，且多指向專業網站，減少對廣告站點的流量。AI 搜尋使用擴大使整體搜尋使用率下降 9.4%，資訊類別受衝擊最大，顯示平台內部滿足需求的趨勢正在削弱傳統搜尋的流量與內容生態。

深度分析

離散擴散語言模型結合凍結 Whisper 與投影層：8 步平行解碼達成 6.6% WER

傳統自回歸語音辨識受限於逐字解碼，研究以離散擴散語言模型直接聽懂音訊，凍結 Whisper 編碼器並加入投影層與低秩適配器，僅訓練 42M 參數即可在約八步平行去噪下完成轉錄，LibriSpeech clean 測得 6.6% 字錯率，顯示擴散解碼可脫離文字長度限制並提升效能。

深度分析

LLM 計畫評分的刪除非單調性與型別狀態門檻：沉默取勝機制分析

研究指出，LLM生成的策略評分器在刪除中間環節後仍保留終值，會因沉默而提升分數。作者提出刪除獎勵公式，驗證在26條路徑中多數可透過沉默提升分數，並以型別狀態門檻阻止此類漏洞。此機制顯示評分系統若未檢測隱蔽刪除，可能誤導投資決策，呼籲加入型別覆蓋門檻以提升可靠性。

深度分析

利用 CDL 與 SDF 渲染的 FormalAnalyticGeo 框架自動生成高品質解析幾何題目

研究針對解析幾何資料稀缺，提出 FormalAnalyticGeo 框架，結合 CDL 形式語言與 SDF 渲染自動產生多模問題，並以品質驗證器閉環檢查，使誤差降至 0.7%，生成超過 7,000 題資料集。此技術比傳統模板或純生成模型在幾何精度與驗證上更具優勢，同時提供開放原始碼與可擴充的工具鏈，促進研究社群與產業合作。

深度分析

「Elenchos」框架：評估大型語言模型逆向推理與變異辨識能力

隨著大型語言模型在前向推理表現卓越，逆向推理能力仍未明朗。研究團隊推出Elenchos框架，透過變形λ演算檢測模型能否辨識與歸因規則變更。結果顯示模型多能偵測異常，卻常無法正確定位變異，顯示抽象因果推理仍是瓶頸。此發現對未來AI安全與可解釋性研究具有重要啟示。

深度分析

「Light-MER」輕量化多模態情感語言模型：SWD‑H 隱層對齊與 M‑GRPO 多獎勵優化實證

隨著多模態大型語言模型推動情感辨識與敘事生成，模型規模卻成部署瓶頸。研究提出 Light-MER，利用知識蒸餾、Sliced Wasserstein 隱層對齊與多獎勵 GRPO，將 8B 教師模型能力壓縮至 854M 參數。實驗證明 Light-MER 平均分數超過教師，顯示小模型亦能提供高品質情感理解與生成。

Latest

無分布假設下的半監督學習：線性風險組合與變異最小化

從 Query‑Aware 到 Query‑Agnostic：KV 快取壓縮方法的全面審計與排名

DoYouRemember：將重建記憶引入多模態大模型的全新架構

BuSNN：透過多脈衝神經元與動態權重提升 SNN 的準確率與抗擾能力

Human‑Inspired GNP (HGNP)：以兒童發展啟發的自適應圖形演化框架

大規模即時語言模型 (Point‑in‑Time LLM) 以 FineWeb 資料提升至 4 B 參數的效能突破

AI 搜尋衝擊傳統搜尋：ChatGPT 只產生 5.2% 外部點擊

離散擴散語言模型結合凍結 Whisper 與投影層：8 步平行解碼達成 6.6% WER

LLM 計畫評分的刪除非單調性與型別狀態門檻：沉默取勝機制分析

利用 CDL 與 SDF 渲染的 FormalAnalyticGeo 框架自動生成高品質解析幾何題目

「Elenchos」框架：評估大型語言模型逆向推理與變異辨識能力

「Light-MER」輕量化多模態情感語言模型：SWD‑H 隱層對齊與 M‑GRPO 多獎勵優化實證

大規模即時語言模型 (Point‑in‑Time LLM) 以 FineWeb 資料提升至 4 B 參數的效能突破