深度分析 - Agents Report | 代理人報告 (Page 78)

深度分析

Google 將搜尋代理化：Gemini 3.5 Flash 與 AI Mode 讓搜尋可執行任務

谷歌把搜尋變主動化了透過Gemini驅動可建立持續代理功能。能追蹤商品與預約等事還能代為搜尋與呼叫。減少使用者主動參與。可能改變流量與曝光。並擴大平台生態掌控。類似程式化工具出現。對開發者與企業衝擊。需重新思考AEO策略也引發隱私與治理爭議監管與平台設計將關鍵

深度分析

小於2B參數的輕量級LLM在判決理由生成（CVG）與罪名預測上的可行性分析

本文系統性評估小於2B參數的輕量級大語言模型(LLM)在刑事判決理由生成（Court View Generation, CVG）任務的表現，並探討生成判決理由對罪名預測的影響。作者建立CVGEvalKit評估框架，對不同架構與規模之開源模型進行微調與比較，並將LLM與傳統深度神經網路(DNN)並列檢驗。

深度分析

Google以Gemini 3.5 Flash導入多模態對話搜尋：從關鍵字到生成式介面

Google在第25年改造搜尋框，將單行關鍵字欄位變為可接受文字、圖片、PDF、影片與分頁的多模態對話入口，並以Gemini 3.5 Flash驅動、合併AI Overviews與AI Mode，讓搜尋從碎片關鍵字走向持續互動，可能改變流量與廣告分配。

深度分析

p-p 單參數模型解析：斷裂式進展的機制與統計特徵

研究追蹤九個前沿領域、逾六百八十萬解答，發現科技進展呈斷裂式跳躍。作者提出單參數p‑p模型，將創新分作激進重置與漸進改良，模型重現等待時間厚尾、紀錄次線性累積與時間相關性。結果顯示開放披露與前沿存取能系統性加速進步，影響AI、藥物與材料等領域。

深度分析

MAVEN（Multi-Agent Video ENrichment）：分維提示與平行協調改善 text-to-video 文化呈現

研究指出現有文字到影片生成常忽略文化差異。本研究提出MAVEN，將提示拆成「人物、動作、地點」三個專責代理人，並比較單一代理、序列與平行多代理。實驗用243個提示與972支影片，平行多代理在文化相關性上表現最佳。研究結論指出，平行專責能在保持影像品質與時間一致性下，加強文化指涉表達。

深度分析

χ-Bench：醫療長距離流程中 AI 代理的政策遵循與多角色協作評測

χ-Bench提出一套高擬真醫療流程基準，模擬先前授權（PA）、利用管理（UM）與護理管理（CM）三大場景，並以20款實務應用、87個MCP工具與1,279份作業手冊作為政策依據。實驗評估30組代理框架與模型組合，最佳配置僅在單次任務上達成28%成功率，整場連續執行全流程時降至3.8%。

深度分析

DeepMind 推出 Gemini 3.5 Flash 與 Antigravity：代理式編碼與雲端整合的戰略意義

在Google I/O，DemisHassabis揭示DeepMind最新Gemini3.5Flash模型。該模型能跨語言翻譯大型程式碼、定位並修復深層錯誤，也示範生成系統軟體；Google透過Antigravity強調速度與成本優勢。這類技術可提高工程師產出，但不見得會馬上取代軟體職位。

深度分析

Gemini Spark 技術解讀：Gemini 3.5 Flash、Antigravity 與 Model Context Protocol 的整合

Google 在 I/O 發表 Gemini Spark，一款可在背景持續運作的個人化人工智慧代理，結合 Gemini 3.5 Flash 與 Antigravity。

Google AI Studio 搭配 Gemini API 生成原生 Android 應用工具

深度分析

Google AI Studio 支援原生應用生成：Gemini API 與硬體整合路徑

Google 在 I/O 推出可直接生成原生 Android 應用的 AI Studio 功能；透過自然語言提示、嵌入式模擬器與實機安裝，快速產生個人化或硬體感知的應用原型；但 Google 強調，若要上架 Google Play，仍需符合既有審核與品質標準，反映自動化工具與平台治理間的拉扯。

深度分析

PrivScope：在混合本地—雲端代理中以任務範圍揭露治理 payload

混合本地—雲端代理在把工作狀態與當前請求合併後，向雲端模型委派子任務時，容易將不必要或過度詳細的個人資訊一併上傳，產生「過度揭露」風險。

深度分析

零樣本語音克隆呈現風格轉移：實驗證實同質化與信任效應

研究探討語音克隆是否真能保留說話者身分。實驗以三款主流克隆模型比較原音與複製音，並以人工評註聲音的權威感、溫暖度與自然度。結果顯示克隆音較原音更具權威與信任感，且出現口音與風格的同質化，可能影響身分辨識與使用者行為。研究指出應提升透明度與監管設計以減輕風險。

深度分析

MetaEns：以元學習預測邊際增益的無監督集成模型選擇

在缺乏標記的場景下，無監督異常偵測難以評估與組合模型。MetaEns透過元學習預測候選檢測器的邊際增益，並以相似度折扣與家族風險正則化促成多樣且精簡的集成。實驗顯示其在39個實務資料集上能以較少模型達成更高平均精確度。該方法兼顧冗贅抑制與風險控管，支援自動停止，減少運算成本並提升穩健性。