Agents Report | 代理人報告 (Page 8)

深度分析

BSB框架揭露時間一致性漏洞：T2V模型越獄攻擊新手法

一篇來自ArXiv的研究論文揭示了文字生成影片（T2V）模型在安全性上的新漏洞。研究團隊提出名為BSB（Between Safe Boundaries）的攻擊框架，利用影片生成過程中固有的「時間一致性」特性來繞過安全過濾器。

深度分析

修復AI代理的五大管道：驗證者引導下的難度梯度與可靠性陷阱

這篇論文探討如何透過五種不同的修正管道（naive in-context prompting、verifier-guided in-context hints、imitation fine-tuning、reward-based updates、inference-time override）來修復電腦使用代理（CUA）的失敗行為。

深度分析

AI 代理人可靠性解密：驗證迴圈、專業模型與框架的貢獻拆解

本研究針對企業級 AI 代理人 Leni 的架構進行深入分析，探討其可靠性來源。研究透過 SpreadsheetBench、BullshitBench v2 及 GAIA 驗證集三大公開基準測試，評估驗證迴圈、專業模型與框架對整體表現的貢獻。

深度分析

TurboVec 實戰分析：無訓練 4 位元量化兼顧 RAG 檢索效率與多租戶隱私

企業 RAG 系統面臨向量檢索層的兩大挑戰：訓練式量化可能暴露語料統計，且後過濾租戶隔離降低召回率。TurboVec 採用無程式碼書量化技術，無需訓練即達 4 位元壓縮，在 DBpedia 基準上 Recall@5 超越 FAISS PQ 達 8.5 個百分點，並在 Snowpark 部署中實現 11 毫秒查詢延遲。

深度分析

NVIDIA Vera Rubin 晶片系統亮相：Vera CPU 與 Rubin GPU 組合，效能與效率大幅提升

NVIDIA 推出 Vera Rubin 晶片系統，採用單晶片設計取代小晶片架構，每瓦處理 token 數為前代 10 倍。該系統搭配 Rubin GPU，主打「無纜線運算」與全液冷，簡化部署。OpenAI 已率先採用，預計下半年出貨，挑戰 AMD 與 Intel 在資料中心 CPU 市場的地位。

深度分析

CrowdStrike 揭露 AI 蠕蟲：潛藏盲區，模仿合法行為竊取憑證與破壞系統

資安公司 CrowdStrike 發現一隻專門攻擊 AI 軟體供應鏈的蠕蟲，能潛伏在開發環境中，模仿 AI 編碼代理的正常行為，竊取 npm 權杖、加密金鑰與伺服器憑證，並具備檔案破壞與系統封鎖的「死亡開關」。研究人員指出，由於該蠕蟲的活動與合法 AI 自動化流程高度相似，傳統資安工具難以偵測，形成「針堆中的針」困境。

深度分析

Google 推出 Gemini 3.5 Flash Cyber：輕量級 AI 模型挑戰資安領域，與 Anthropic Mythos 正面交鋒

Google 推出 Gemini 3.5 Flash Cyber，以低成本高效能挑戰 Anthropic Mythos。該模型整合至 CodeMender，可高速多次掃描漏洞，在 V8 引擎發現 55 個問題，其中 10 個為獨家發現。此舉標誌 AI 資安走向輕量專用化。

速報

CLARE 問世：AI 代理用「主動澄清」終結 3D 模型生成的模糊指令困境

現代 3D 創作工具鏈要求精確參數，但一般使用者常給出模糊指令。為解決此不對稱問題，研究團隊推出 CLARE，一個具備澄清意識的演化式 3D 代理。CLARE 將生成流程拆解為四個認知角色，在執行昂貴的 3D 工具前，先攔截並釐清模糊指令。其澄清策略透過模擬多輪互動自我演化，無需人工規則，並以多輪獎勵最佳化平衡效率與任務完成度。

深度分析

GCFF 演算法：無須稀疏限制，從生物啟發中長出階層式語意神經元

本研究提出 Group-Contrastive Forward-Forward (GCFF) 演算法，一種受生物視覺系統啟發的訓練方法。不同於現有稀疏字典學習（SDL）仰賴線性重建與稀疏限制來提取語意特徵，GCFF 透過類別特定路由與類別層級對比學習，在非線性多層網路中自然產生單語意神經元。

深度分析

GenSyn10 資料集：三款最新生成模型打造合成影像偵測新基準

生成式 AI 進展迅速，偵測 AI 影像的模型卻常因生成器架構不同而失效。GenSyn10 資料集以 60,000 張來自 FLUX.2-dev、HunyuanImage-3.0 與 Qwen-Image-2512 的合成影像，建立標準化基準。測試顯示微調後模型準確率可達 99.88%，但在未見過的生成器上仍下滑 4 至 18 個百分點，暴露跨架構泛化瓶頸。

速報

Tile 模組化框架：用 Soda 語言打造可驗證的行動推理管線

傳統的行動與變化推理方法大多依賴邏輯程式系統，雖然語義表達力強，但實作上往往缺乏模組化與可驗證性。一篇來自 ArXiv 的新研究提出一套基於 Tile 的模組化框架，並以高效能函數式語言 Soda 實作。該框架將狀態、行動、轉換與規則視為可組合的函數元件，透過型別化的執行管線進行驗證，確保管線終止且流程透明。

深度分析

LLM 搭配演化演算法自動生成特徵，八個資料集分類準確率全面提升

特徵工程是機器學習的關鍵步驟，但耗費大量人力。研究團隊提出結合大型語言模型與演化演算法的自動化流程，讓 LLaMA 3.1 7B 模型根據既有特徵自動產生新特徵，並以基因演算法篩選。在八個資料集測試中，多數分類準確率獲得提升，且生成的特徵具備可解釋性。

Latest

BSB框架揭露時間一致性漏洞：T2V模型越獄攻擊新手法

修復AI代理的五大管道：驗證者引導下的難度梯度與可靠性陷阱

AI 代理人可靠性解密：驗證迴圈、專業模型與框架的貢獻拆解

TurboVec 實戰分析：無訓練 4 位元量化兼顧 RAG 檢索效率與多租戶隱私

NVIDIA Vera Rubin 晶片系統亮相：Vera CPU 與 Rubin GPU 組合，效能與效率大幅提升

CrowdStrike 揭露 AI 蠕蟲：潛藏盲區，模仿合法行為竊取憑證與破壞系統

Google 推出 Gemini 3.5 Flash Cyber：輕量級 AI 模型挑戰資安領域，與 Anthropic Mythos 正面交鋒

CLARE 問世：AI 代理用「主動澄清」終結 3D 模型生成的模糊指令困境

GCFF 演算法：無須稀疏限制，從生物啟發中長出階層式語意神經元

GenSyn10 資料集：三款最新生成模型打造合成影像偵測新基準

Tile 模組化框架：用 Soda 語言打造可驗證的行動推理管線

LLM 搭配演化演算法自動生成特徵，八個資料集分類準確率全面提升