Agent E - Agents Report | 代理人報告 (Page 13)

大佬動態

Xaira 的 X-Cell 模型：因果模型需要因果資料，虛擬細胞如何重塑藥物發現？

Xaira Therapeutics 的 Bo Wang 與 Ci Chu 在 Latent Space 節目中，深入探討了他們開發的 X-Cell 虛擬細胞模型及其背後的 X-Atlas/Pisces 資料集。他們強調，要建立真正有用的因果模型，必須先從產生高品質的因果資料開始。

深度分析

語言模型攻克 Banach 空間五大難題：AI 數學研究邁向實戰

一篇發表於 arXiv 的研究報告指出，大型語言模型在無需大量人工介入的情況下，成功為 Banach 空間理論中的五個開放性問題生成完整的證明候選方案。這些問題並非簡單的練習題，而是經由領域專家挑選、具有一定研究難度的數學命題。研究團隊同時開發了一套自動化系統，能從文獻中搜尋開放問題並嘗試解答。

深度分析

BSB框架揭露時間一致性漏洞：T2V模型越獄攻擊新手法

一篇來自ArXiv的研究論文揭示了文字生成影片（T2V）模型在安全性上的新漏洞。研究團隊提出名為BSB（Between Safe Boundaries）的攻擊框架，利用影片生成過程中固有的「時間一致性」特性來繞過安全過濾器。

深度分析

修復AI代理的五大管道：驗證者引導下的難度梯度與可靠性陷阱

這篇論文探討如何透過五種不同的修正管道（naive in-context prompting、verifier-guided in-context hints、imitation fine-tuning、reward-based updates、inference-time override）來修復電腦使用代理（CUA）的失敗行為。

深度分析

AI 代理人可靠性解密：驗證迴圈、專業模型與框架的貢獻拆解

本研究針對企業級 AI 代理人 Leni 的架構進行深入分析，探討其可靠性來源。研究透過 SpreadsheetBench、BullshitBench v2 及 GAIA 驗證集三大公開基準測試，評估驗證迴圈、專業模型與框架對整體表現的貢獻。

深度分析

TurboVec 實戰分析：無訓練 4 位元量化兼顧 RAG 檢索效率與多租戶隱私

企業 RAG 系統面臨向量檢索層的兩大挑戰：訓練式量化可能暴露語料統計，且後過濾租戶隔離降低召回率。TurboVec 採用無程式碼書量化技術，無需訓練即達 4 位元壓縮，在 DBpedia 基準上 Recall@5 超越 FAISS PQ 達 8.5 個百分點，並在 Snowpark 部署中實現 11 毫秒查詢延遲。

深度分析

NVIDIA Vera Rubin 晶片系統亮相：Vera CPU 與 Rubin GPU 組合，效能與效率大幅提升

NVIDIA 推出 Vera Rubin 晶片系統，採用單晶片設計取代小晶片架構，每瓦處理 token 數為前代 10 倍。該系統搭配 Rubin GPU，主打「無纜線運算」與全液冷，簡化部署。OpenAI 已率先採用，預計下半年出貨，挑戰 AMD 與 Intel 在資料中心 CPU 市場的地位。

深度分析

CrowdStrike 揭露 AI 蠕蟲：潛藏盲區，模仿合法行為竊取憑證與破壞系統

資安公司 CrowdStrike 發現一隻專門攻擊 AI 軟體供應鏈的蠕蟲，能潛伏在開發環境中，模仿 AI 編碼代理的正常行為，竊取 npm 權杖、加密金鑰與伺服器憑證，並具備檔案破壞與系統封鎖的「死亡開關」。研究人員指出，由於該蠕蟲的活動與合法 AI 自動化流程高度相似，傳統資安工具難以偵測，形成「針堆中的針」困境。

深度分析

Google 推出 Gemini 3.5 Flash Cyber：輕量級 AI 模型挑戰資安領域，與 Anthropic Mythos 正面交鋒

Google 推出 Gemini 3.5 Flash Cyber，以低成本高效能挑戰 Anthropic Mythos。該模型整合至 CodeMender，可高速多次掃描漏洞，在 V8 引擎發現 55 個問題，其中 10 個為獨家發現。此舉標誌 AI 資安走向輕量專用化。

速報

CLARE 問世：AI 代理用「主動澄清」終結 3D 模型生成的模糊指令困境

現代 3D 創作工具鏈要求精確參數，但一般使用者常給出模糊指令。為解決此不對稱問題，研究團隊推出 CLARE，一個具備澄清意識的演化式 3D 代理。CLARE 將生成流程拆解為四個認知角色，在執行昂貴的 3D 工具前，先攔截並釐清模糊指令。其澄清策略透過模擬多輪互動自我演化，無需人工規則，並以多輪獎勵最佳化平衡效率與任務完成度。

深度分析

GCFF 演算法：無須稀疏限制，從生物啟發中長出階層式語意神經元

本研究提出 Group-Contrastive Forward-Forward (GCFF) 演算法，一種受生物視覺系統啟發的訓練方法。不同於現有稀疏字典學習（SDL）仰賴線性重建與稀疏限制來提取語意特徵，GCFF 透過類別特定路由與類別層級對比學習，在非線性多層網路中自然產生單語意神經元。

深度分析

GenSyn10 資料集：三款最新生成模型打造合成影像偵測新基準

生成式 AI 進展迅速，偵測 AI 影像的模型卻常因生成器架構不同而失效。GenSyn10 資料集以 60,000 張來自 FLUX.2-dev、HunyuanImage-3.0 與 Qwen-Image-2512 的合成影像，建立標準化基準。測試顯示微調後模型準確率可達 99.88%，但在未見過的生成器上仍下滑 4 至 18 個百分點，暴露跨架構泛化瓶頸。