深度分析
Google 將搜尋代理化:Gemini 3.5 Flash 與 AI Mode 讓搜尋可執行任務
谷歌把搜尋變主動化了透過Gemini驅動可建立持續代理功能。能追蹤商品與預約等事還能代為搜尋與呼叫。減少使用者主動參與。可能改變流量與曝光。並擴大平台生態掌控。類似程式化工具出現。對開發者與企業衝擊。需重新思考AEO策略也引發隱私與治理爭議監管與平台設計將關鍵
深度分析
谷歌把搜尋變主動化了透過Gemini驅動可建立持續代理功能。能追蹤商品與預約等事還能代為搜尋與呼叫。減少使用者主動參與。可能改變流量與曝光。並擴大平台生態掌控。類似程式化工具出現。對開發者與企業衝擊。需重新思考AEO策略也引發隱私與治理爭議監管與平台設計將關鍵
深度分析
本文系統性評估小於2B參數的輕量級大語言模型(LLM)在刑事判決理由生成(Court View Generation, CVG)任務的表現,並探討生成判決理由對罪名預測的影響。作者建立CVGEvalKit評估框架,對不同架構與規模之開源模型進行微調與比較,並將LLM與傳統深度神經網路(DNN)並列檢驗。
深度分析
Google在第25年改造搜尋框,將單行關鍵字欄位變為可接受文字、圖片、PDF、影片與分頁的多模態對話入口,並以Gemini 3.5 Flash驅動、合併AI Overviews與AI Mode,讓搜尋從碎片關鍵字走向持續互動,可能改變流量與廣告分配。
深度分析
研究追蹤九個前沿領域、逾六百八十萬解答,發現科技進展呈斷裂式跳躍。作者提出單參數p‑p模型,將創新分作激進重置與漸進改良,模型重現等待時間厚尾、紀錄次線性累積與時間相關性。結果顯示開放披露與前沿存取能系統性加速進步,影響AI、藥物與材料等領域。
深度分析
研究指出現有文字到影片生成常忽略文化差異。本研究提出MAVEN,將提示拆成「人物、動作、地點」三個專責代理人,並比較單一代理、序列與平行多代理。實驗用243個提示與972支影片,平行多代理在文化相關性上表現最佳。研究結論指出,平行專責能在保持影像品質與時間一致性下,加強文化指涉表達。
深度分析
χ-Bench提出一套高擬真醫療流程基準,模擬先前授權(PA)、利用管理(UM)與護理管理(CM)三大場景,並以20款實務應用、87個MCP工具與1,279份作業手冊作為政策依據。實驗評估30組代理框架與模型組合,最佳配置僅在單次任務上達成28%成功率,整場連續執行全流程時降至3.8%。
深度分析
在Google I/O,DemisHassabis揭示DeepMind最新Gemini3.5Flash模型。該模型能跨語言翻譯大型程式碼、定位並修復深層錯誤,也示範生成系統軟體;Google透過Antigravity強調速度與成本優勢。這類技術可提高工程師產出,但不見得會馬上取代軟體職位。
深度分析
Google 在 I/O 發表 Gemini Spark,一款可在背景持續運作的個人化人工智慧代理,結合 Gemini 3.5 Flash 與 Antigravity。
深度分析
Google 在 I/O 推出可直接生成原生 Android 應用的 AI Studio 功能;透過自然語言提示、嵌入式模擬器與實機安裝,快速產生個人化或硬體感知的應用原型;但 Google 強調,若要上架 Google Play,仍需符合既有審核與品質標準,反映自動化工具與平台治理間的拉扯。
深度分析
混合本地—雲端代理在把工作狀態與當前請求合併後,向雲端模型委派子任務時,容易將不必要或過度詳細的個人資訊一併上傳,產生「過度揭露」風險。
深度分析
研究探討語音克隆是否真能保留說話者身分。實驗以三款主流克隆模型比較原音與複製音,並以人工評註聲音的權威感、溫暖度與自然度。結果顯示克隆音較原音更具權威與信任感,且出現口音與風格的同質化,可能影響身分辨識與使用者行為。研究指出應提升透明度與監管設計以減輕風險。
深度分析
在缺乏標記的場景下,無監督異常偵測難以評估與組合模型。MetaEns透過元學習預測候選檢測器的邊際增益,並以相似度折扣與家族風險正則化促成多樣且精簡的集成。實驗顯示其在39個實務資料集上能以較少模型達成更高平均精確度。該方法兼顧冗贅抑制與風險控管,支援自動停止,減少運算成本並提升穩健性。