Agents Report | 代理人報告 (Page 35)

深度分析

Jetson-PI 以未來校正模組優化 Vision‑Language‑Action 非同步推論，實現 6 Hz 以上控制頻率

研究針對在JetsonOrin等低功耗晶片上部署Vision‑Language‑Action模型的延遲問題，提出以未來校正為核心的Jetson‑PI方法，透過輕量化未來環境預測與信心排程，同步提升推論頻率與反應速度。實驗顯示在LIBERO基準上控制頻率提升逾八倍，成功率提升近十五%。

An infographic of the LakeQuest benchmark evaluating AI agent multi-modal retrieval and reasoning in data lakes.

深度分析

LakeQuest 基準：評估資料湖中的多模態檢索與 AI 代理人推理效能

研究指出現實資料湖缺乏有效評測環境，提出LakeQuest基準以表格、文字與元資料混合測試檢索與推理。測試顯示即使檢索正確，跨來源合成仍常失敗，凸顯未來需要更健全的多模態組合與證據追蹤機制。基準涵蓋AI/ML元資料、零售銀行與生醫藥物三大領域，測試11種模型發現檢索高但推理正確率僅約30%。

深度分析

ARDepth：階層式自回歸單眼深度估計新突破，結合 SPC 與 SAG 提升零樣本泛化

單張影像深度估計近年多採用擴散模型，但在保持銳利邊界與細部結構上仍有挑戰。ARDepth以階層式自回歸方式，結合多尺度視覺條件與語意感知指導，逐層構建深度圖。實驗顯示其在多項零樣本基準上達到或超越最先進表現，顯示自回歸生成是幾何建模的可行新方向。預期此架構將推動深度模型商業化與開發者生態的多元創新。

深度分析

Fin‑Analyst 多專家 LLM 交易系統結合 Meta‑Agent 在 CLEF 2026 取得首位

FinMMEval 2026 Task 3 評估 LLM 交易代理，Fin‑Analyst 以八位專家結合新聞、SEC、基本面等資訊，透過 Meta‑Agent 為特斯拉 (TSLA) 產生 +13.51% 報酬率、Sharpe 4.10，且在比特幣 (BTC) 採用三信號投票維持資本。

An infographic comparing human semantic search exploration with LLM search limits.

速報

大型語言模型在語意記憶檢索上的探索度與人類仍有差距

本研究以語意流暢測驗比較人類與三款大型語言模型的搜尋行為，採用熵、步距與中心距三項指標量化。結果發現人類的語意搜尋更具變化與探索性，模型即使調整溫度亦只能在單一指標上對齊，無法同時複製人類的完整特徵，顯示目前模型仍缺乏平衡局部與全域探索的能力。

深度分析

TRAIL：可配置 AI 夥伴平台的雙記憶與 Big Five 人格實驗設計

隨著大語言模型進入協作工作，研究者需要可重現的 AI 夥伴實驗平台。TRAIL 以 Big Five 人格模型結合雙記憶與選擇性發言管線，讓 AI 角色可在即時聊天室中以固定比例參與，並自動匯出多層次分析資料。實驗顯示，僅改變 AI 人格即能在貢獻評分與團隊氛圍上產生相反效果，證明平台可精準操控團隊動態。

An infographic of the 975 billion-parameter Inkling model trained on Nvidia GB300 GPUs with multimodal capabilities.

深度分析

Thinking Machines Lab 推出 9750 億參數 Inkling，搭載 Nvidia GB300 高效能 GPU

ThinkingMachinesLab於2025年成立，發布開放權重模型Inkling，使用NvidiaGB300晶片在Google雲端訓練，擁有9750億參數，能同時理解音視訊與文字並支援程式碼生成，預計將推動AI開源生態與本地供應鏈需求。

深度分析

AutoTrace：結合 LLM 代理人與程式屬性圖的跨函式漏洞觸發定位技術

傳統漏洞偵測只告訴哪個函式可能有問題，卻無法指出具體觸發語句。AutoTrace以大型語言模型代理人搭配程式屬性圖逐層探索，透過確定性驗證門只在取得完整證據後回報觸發點，成功定位跨多層呼叫的漏洞觸發語句。實驗顯示在InterPVD基準上達到75%VulnHit與81%FuncHit，超過既有工具。

深度分析

參考式合成影像歸屬：中層特徵與語意對齊的效能突破

合成影像歸屬研究聚焦於不需訓練的參考式方法，分析表徵層級與參考選取的交互。結果顯示中層CLIP/DINO表徵最佳，語意對齊參考提升準確，對未來AI產業的防偽與模型追蹤具重要意義。研究比較了任意、語意對齊與重合成三種參考策略，發現在參考數量受限時，重合成可顯著提升辨識率。

深度分析

Transformer FFN 稀疏層間依賴解析：免訓練歸因方法揭示 GPT‑2 與 Qwen2.5 計算路徑

研究針對 Transformer 中的前饋網路神經元，提出免訓練歸因方法，發現僅需少量前層激活與注意力輸出即可重建神經元激活，且在適度稀疏下模型困惑度不變。實驗覆蓋 GPT‑2 系列與 Qwen2.5 多種規模，顯示約 17%‑19% 神經元具可辨識的專門計算，且稀疏路徑呈次線性增長，為模型壓縮與電路解釋提供新方向。

深度分析

座標自由校正與功能指紋辨識：神經崩潰下 MLP 模型的捐贈者專屬指紋

本研究以五個獨立訓練的 MLP‑5 網路在 MNIST 上重現神經崩潰現象，採用正交 Procrustes 對齊與仿射校正將捐贈者分類頭映射至受贈者座標系。結果顯示，在完成受贈者層級的基線校正後，所有 20 組捐贈者‑受贈者配對均能正確辨識，統計檢驗 p=0.0083，證實功能指紋的可偵測性。

深度分析

Meta 20 個月重建 AI Agent 基礎設施：容量、身分驗證與即時串流

Meta 工程副總裁指出企業基礎設施正因 AI Agent 爆發而面臨挑戰。Meta 透過建立信任數據環境來確保治理，將批處理 ETL 轉向即時串流，並開發對 Schema 具備感知的儲存系統以支援推理模型。此舉旨在解決容量、身分驗證與速度失效的問題，讓基礎設施能支援每秒 5 億次查詢，並將 AI Agent 轉化為高效能的協作工具。

Latest

Jetson-PI 以未來校正模組優化 Vision‑Language‑Action 非同步推論，實現 6 Hz 以上控制頻率

LakeQuest 基準：評估資料湖中的多模態檢索與 AI 代理人推理效能

ARDepth：階層式自回歸單眼深度估計新突破，結合 SPC 與 SAG 提升零樣本泛化

Fin‑Analyst 多專家 LLM 交易系統結合 Meta‑Agent 在 CLEF 2026 取得首位

大型語言模型在語意記憶檢索上的探索度與人類仍有差距

TRAIL：可配置 AI 夥伴平台的雙記憶與 Big Five 人格實驗設計

Thinking Machines Lab 推出 9750 億參數 Inkling，搭載 Nvidia GB300 高效能 GPU

AutoTrace：結合 LLM 代理人與程式屬性圖的跨函式漏洞觸發定位技術

參考式合成影像歸屬：中層特徵與語意對齊的效能突破

Transformer FFN 稀疏層間依賴解析：免訓練歸因方法揭示 GPT‑2 與 Qwen2.5 計算路徑

座標自由校正與功能指紋辨識：神經崩潰下 MLP 模型的捐贈者專屬指紋

Meta 20 個月重建 AI Agent 基礎設施：容量、身分驗證與即時串流

Jetson-PI 以未來校正模組優化 Vision‑Language‑Action 非同步推論，實現 6 Hz 以上控制頻率

Fin‑Analyst 多專家 LLM 交易系統結合 Meta‑Agent 在 CLEF 2026 取得首位