生成式人工智慧 - Agents Report

CodeMender

Google 以 CodeMender 擴展程式碼安全檢測：回應 Anthropic 的 Mythos

在GoogleI/O，Google將CodeMender推向外部專家測試，主打以AI代理檢測並嘗試修補程式碼弱點。DeepMind的高層稱其能「協助保護全球程式碼庫」，並已與政府及企業洽談導入。此舉被視為對Anthropic的Mythos預覽所引發關注的回應，或將加速資安領域的商業化。

Google AI Overviews 在 Reddit 內容互動與搜尋效應提升

深度分析

Google AI Overviews 重塑內容生態：以 Reddit 實證分析 AI 搜尋的替代與發現效應

研究檢視GoogleAIOverviews將生成式人工智慧嵌入搜尋後如何改變線上內容流量。作者以RedditSFW對照NSFW社群採用差異中差異設計分類搜尋型與經驗型內容比較靜態摘要與對話式介面。結果顯示AIOverviews整體提升SFW社群留言與作者活躍度並指出介面設計會顯著調節發現與替代效應。

深度分析

生成式人工智慧與大型語言模型：AIC 解釋 GenAI 產能不均的原因

本研究透過隨機對照實驗，模擬新進知識工作者在短期自學技術領域時，對比傳統資源與大語言模型（LLM）輔助的成效。結果顯示：開放 LLM 明顯提高平均表現，但成效分佈高度不均；關鍵決定因子不是GPA或既有知識，而是AI互動能力（AI Interaction Competence, AIC）——能否有效引導、篩選與驗證模型輸出。

眼動追蹤

眼動追蹤與NASA-TLX研究：生成式人工智慧揭露呈現對閱讀負擔的影響

隨著生成式人工智慧逐步滲入新聞生產，如何揭露AI使用同時不增加讀者負擔成為設計難題。一項3×2×2混合實驗以眼動追蹤與NASA-TLX比較三種揭露詳度（無標示、一行、詳盡）、兩類新聞（政治與生活）以及AI角色（編輯、部分生成）對注意力與認知負擔的影響。

深度分析

生成式人工智慧個資洩露：Google Gemini 與 ChatGPT 的手機號碼外洩分析

近期多起案例顯示，像 Google Gemini、ChatGPT 與 Claude 等生成式人工智慧在回應中有時會產出他人的真實手機號碼，導致陌生來電與騷擾。研究與個資清除業者指出，模型訓練資料中包含大量個人可識別資訊（PII），再加上模型的記憶與重現機制，使得過濾措施無法完全阻止此類洩露。

深度分析

Netflix INKubator：以生成式人工智慧整合企業級動畫製作流程

Netflix 正悄悄建立名為 INKubator（又稱 INK）的內部動畫工作室，透過生成式人工智慧重構動畫製作流程。公司已發布多項職缺，徵求製作人、軟體工程師與 CG 藝術家，職缺說明把重點放在 GenAI 原生工作流程、藝術家工具與可擴展的多節目環境，並以製作短篇與特別節目為起點，同時保留擴展到長篇內容的可能性。

速報

研究：生成式人工智慧改變認知作戰——2024選舉貼文顯現新操作邏輯

研究比較2016與2024年美國總統大選推文，探討認知作戰的新威脅。透過語義分群、時間同步與Jaccard詞彙重疊量化分析，聚焦生成式人工智慧可能的操作邏輯。發現2024年以原創內容與敘事化同現為主，顯示生成式人工智慧改變了認知作戰模式化。

人工智慧部署

以情境規格提升人工智慧部署評估的可用性與可觀測指標

本研究提出「情境規格」作為連結評估與部署決策的程序，主張將利害關係人的關切轉為具名且可觀測的構念，並定義使用情境、聯結機制與可觀察證據需求。方法強調以部署現實為輸入，透過系統化步驟把抽象績效指標翻譯成評估目標，並示範在公營運輸人資篩選等真實場景的應用，協助組織更有根據地判斷何時、何地、如何採用 AI 工具。

速報

生成式人工智慧改寫就業地圖：從 prompt 工程到人機混合技能

研究聚焦生成式人工智慧如何改寫全球職場技能與職缺需求。採用逾150,000筆英文職缺語料，運用BERTopic、LDA、KMeans、句向量嵌入與ARIMA時間序列等方法進行分析。結果指出自2021年後AI相關技能提及急速上升，顯示人機混合能力正在成為就業關鍵。

深度分析

LAION-Aesthetics（LAP）美學評分器偏誤稽核：量化與數位人類學調查

本研究針對廣泛被用於視覺生成式人工智慧資料篩選與評估的 LAION-Aesthetics Predictor（LAP）進行稽核與數位人類學調查。研究先以 LAP 篩選出的 LAION-Aesthetics 資料集（約 1.2B 圖片）與兩個藝術資料庫（合計約 33萬張圖片）為對象，檢視 LAP 對圖像與描述文字的評分傾向。

速報

Google Cloud 營收首破 200 億美元，Gemini Enterprise 與 TPU 推動成長

母公司Alphabet旗下的Google Cloud在本季交出亮眼成績。成長主因為Gemini Enterprise及生成式人工智慧產品推動，公司亦擴充TPU與資料中心以滿足需求。生成式模型驅動的產品使用量和大型合約顯著增加，但短期仍受計算資源供給限制。市場反應強烈。

深度分析

單一對齊模型與Token上限：生成式人工智慧的最適定價機制

隨著商業化推進，基於使用量的Token計價成為產業常態。本文以會話生成速率限制構建機制設計框架，將模型訓練與收費分離，並以單一對齊模型配合Token上限進行分層篩選與收費。結果指出：單模型搭配Token上限可在收入上達到最適，並減輕模型不對齊壓力。