深度分析 - Agents Report | 代理人報告 (Page 27)

深度分析

Fin‑Analyst 多專家 LLM 交易系統結合 Meta‑Agent 在 CLEF 2026 取得首位

FinMMEval 2026 Task 3 評估 LLM 交易代理，Fin‑Analyst 以八位專家結合新聞、SEC、基本面等資訊，透過 Meta‑Agent 為特斯拉 (TSLA) 產生 +13.51% 報酬率、Sharpe 4.10，且在比特幣 (BTC) 採用三信號投票維持資本。

深度分析

TRAIL：可配置 AI 夥伴平台的雙記憶與 Big Five 人格實驗設計

隨著大語言模型進入協作工作，研究者需要可重現的 AI 夥伴實驗平台。TRAIL 以 Big Five 人格模型結合雙記憶與選擇性發言管線，讓 AI 角色可在即時聊天室中以固定比例參與，並自動匯出多層次分析資料。實驗顯示，僅改變 AI 人格即能在貢獻評分與團隊氛圍上產生相反效果，證明平台可精準操控團隊動態。

An infographic of the 975 billion-parameter Inkling model trained on Nvidia GB300 GPUs with multimodal capabilities.

深度分析

Thinking Machines Lab 推出 9750 億參數 Inkling，搭載 Nvidia GB300 高效能 GPU

ThinkingMachinesLab於2025年成立，發布開放權重模型Inkling，使用NvidiaGB300晶片在Google雲端訓練，擁有9750億參數，能同時理解音視訊與文字並支援程式碼生成，預計將推動AI開源生態與本地供應鏈需求。

深度分析

AutoTrace：結合 LLM 代理人與程式屬性圖的跨函式漏洞觸發定位技術

傳統漏洞偵測只告訴哪個函式可能有問題，卻無法指出具體觸發語句。AutoTrace以大型語言模型代理人搭配程式屬性圖逐層探索，透過確定性驗證門只在取得完整證據後回報觸發點，成功定位跨多層呼叫的漏洞觸發語句。實驗顯示在InterPVD基準上達到75%VulnHit與81%FuncHit，超過既有工具。

深度分析

參考式合成影像歸屬：中層特徵與語意對齊的效能突破

合成影像歸屬研究聚焦於不需訓練的參考式方法，分析表徵層級與參考選取的交互。結果顯示中層CLIP/DINO表徵最佳，語意對齊參考提升準確，對未來AI產業的防偽與模型追蹤具重要意義。研究比較了任意、語意對齊與重合成三種參考策略，發現在參考數量受限時，重合成可顯著提升辨識率。

深度分析

Transformer FFN 稀疏層間依賴解析：免訓練歸因方法揭示 GPT‑2 與 Qwen2.5 計算路徑

研究針對 Transformer 中的前饋網路神經元，提出免訓練歸因方法，發現僅需少量前層激活與注意力輸出即可重建神經元激活，且在適度稀疏下模型困惑度不變。實驗覆蓋 GPT‑2 系列與 Qwen2.5 多種規模，顯示約 17%‑19% 神經元具可辨識的專門計算，且稀疏路徑呈次線性增長，為模型壓縮與電路解釋提供新方向。

深度分析

座標自由校正與功能指紋辨識：神經崩潰下 MLP 模型的捐贈者專屬指紋

本研究以五個獨立訓練的 MLP‑5 網路在 MNIST 上重現神經崩潰現象，採用正交 Procrustes 對齊與仿射校正將捐贈者分類頭映射至受贈者座標系。結果顯示，在完成受贈者層級的基線校正後，所有 20 組捐贈者‑受贈者配對均能正確辨識，統計檢驗 p=0.0083，證實功能指紋的可偵測性。

深度分析

Meta 20 個月重建 AI Agent 基礎設施：容量、身分驗證與即時串流

Meta 工程副總裁指出企業基礎設施正因 AI Agent 爆發而面臨挑戰。Meta 透過建立信任數據環境來確保治理，將批處理 ETL 轉向即時串流，並開發對 Schema 具備感知的儲存系統以支援推理模型。此舉旨在解決容量、身分驗證與速度失效的問題，讓基礎設施能支援每秒 5 億次查詢，並將 AI Agent 轉化為高效能的協作工具。

深度分析

無分布假設下的半監督學習：線性風險組合與變異最小化

半監督學習因標記成本高而受矚目，但多數方法依賴資料分布假設，如流形或叢集假設，若假設不成立會導致效能下降。本文提出一套通用的風險重寫框架，透過線性組合各類風險構建無偏估計子，既涵蓋既有的 PNU 方法，也自然延伸至多類別情境，並在一般與非對稱損失下推導出可達到的最小變異下界，證明在不對稱損失時可優於 PNU。

深度分析

從 Query‑Aware 到 Query‑Agnostic：KV 快取壓縮方法的全面審計與排名

本研究針對 KV 快取壓縮在查詢可見性不同下的表現進行配額匹配審計，發現只有 KeyDiff 在查詢無關情境仍優於三種平凡基線；SnapKV 在加入問題後才顯著提升。結果顯示查詢感知分數掺雜了問題相關性，對部署成本與評估可靠性產生影響。此外，審計揭露注意力後端混淆與基準長度依賴等兩項可重現的評估風險。

An infographic of BuSNN architecture combining burst-enhanced neurons and dynamic weight constraints for robust SNNs.

深度分析

BuSNN：透過多脈衝神經元與動態權重提升 SNN 的準確率與抗擾能力

隨著脈衝神經網路（SNN）在視覺任務上逼近人工神經網路（ANN）的表現，研究聚焦於提升其在輸入擾動下的穩定性。本文提出結合爆發式脈衝神經元（BSN）與動態權重約束（DWC）的BuSNN，藉由多脈衝發放與權重自適應懲罰降低激活與權重變化。實驗顯示在CIFAR-10與ImageNet上，BuSNN分別提升3.18%與2.66%的top‑1準確率與魯棒性，且能以低於ANN四倍的能耗運作。

深度分析

大規模即時語言模型 (Point‑in‑Time LLM) 以 FineWeb 資料提升至 4 B 參數的效能突破

隨著大型語言模型在金融與社會科學的應用日增，未限制時間的訓練資料會產生前視偏誤。研究者以月為單位切割，將模型擴至40億參數、使用1兆時間序列過濾的網頁文字，並以LoRA微調。結果顯示，即時模型在常識推理與語意理解上接近Gemma‑3‑4B與LLaMA‑7B，且在資產定價測試中具顯著預測能力。

Fin‑Analyst 多專家 LLM 交易系統結合 Meta‑Agent 在 CLEF 2026 取得首位

TRAIL：可配置 AI 夥伴平台的雙記憶與 Big Five 人格實驗設計

Thinking Machines Lab 推出 9750 億參數 Inkling，搭載 Nvidia GB300 高效能 GPU

AutoTrace：結合 LLM 代理人與程式屬性圖的跨函式漏洞觸發定位技術

參考式合成影像歸屬：中層特徵與語意對齊的效能突破

Transformer FFN 稀疏層間依賴解析：免訓練歸因方法揭示 GPT‑2 與 Qwen2.5 計算路徑

座標自由校正與功能指紋辨識：神經崩潰下 MLP 模型的捐贈者專屬指紋

Meta 20 個月重建 AI Agent 基礎設施：容量、身分驗證與即時串流

無分布假設下的半監督學習：線性風險組合與變異最小化

從 Query‑Aware 到 Query‑Agnostic：KV 快取壓縮方法的全面審計與排名

BuSNN：透過多脈衝神經元與動態權重提升 SNN 的準確率與抗擾能力

大規模即時語言模型 (Point‑in‑Time LLM) 以 FineWeb 資料提升至 4 B 參數的效能突破

Fin‑Analyst 多專家 LLM 交易系統結合 Meta‑Agent 在 CLEF 2026 取得首位

大規模即時語言模型 (Point‑in‑Time LLM) 以 FineWeb 資料提升至 4 B 參數的效能突破