人工智慧 - Agents Report

速報

自動化科學知識生成框架：將文獻轉為 AI 可用的統一知識庫

人工智慧在科學探索受限於結構化知識缺乏。研究團隊打造自主科學知識生成框架，結合本體導向取得、混合抽取與語意融合，將文獻轉為 AI 可用的統一知識庫。以電光材料為例，從千篇文獻抽取八篇，產出 29 筆結構化記錄並匯整為 7 筆標準化資料，展示完整轉換流程與保留實驗細節的能力。

深度分析

「演化智慧」驅動 AI 科學發現：從演化計算到自動化實驗與大型語言模型的累積式探索系統

本報導深入探討演化智慧（EI）如何將傳統演化計算（EC）升級為支援累積式科學發現的框架。文章先說明 AI 從任務導向自動化向閉環探索系統的轉變，接著以五維分析模型說明 EI 在「演化目標、變異來源、選擇依據、回饋來源、演化時機」五個面向的設計要素，並比較現有 EC 方法在候選集、變異操作與回饋形式上的限制。

速報

AI 指數第九報告揭示治理與測試落差，生成式 AI 經濟價值首次量化

AI 指數第九版報告指出，人工智慧技術快速進步，卻面臨治理框架、評估方法、教育體系與資料基礎建設等配套不足的挑戰。報告首次以更高標準測試 AI 在推理、安全與實務任務上的表現，並說明相關指標的可靠性問題。

深度分析

解析 AI 部署的 α、β 通道模型：如何避免增強陷阱與長期技能衰退

本研究以動態模型分析AI使用強度，將生產力提升分為α（技能中性）與β（與專業互補）兩條通道，辨識出五種部署情境，其中兩種會導致增強陷阱，使員工長期產能低於未採用AI前水平；短視管理或未考慮技能外部性更易陷入此困境。建議延長評估視野與加強訓練，提高β比率以防止技能流失。

速報

AI Index 第九版報告：生成式 AI 經濟價值與治理挑戰

AI Index 第九版報告指出，人工智慧技術快速演進的同時，相關治理、評估、教育與資料基礎建設仍難以同步。報告首次以更高雄心測試推理、安全與實務任務的 AI 表現，並說明這些測量的可靠性問題。新增的生成式 AI 經濟價值估算與勞動市場影響證據，顯示其商業潛力與職場衝擊。

速報

AI 輔助下的自主權讓渡：人類決策的認知成本模型

隨著人工智慧融入決策環境，人類的自主權正被逐步讓渡。研究提出三大機制：AI 輔助的沉默成本、讓渡門檻與恢復機制，說明認知帶寬耗盡如何使自主功能難以回收。結果顯示，若未設計結構化的重新介入路徑，使用者可能形成對 AI 的功能依賴，將自主恢復變成文化與政治層面的挑戰。

深度分析

ASyMOB 基準評測：大型語言模型在符號數學上的脆弱與突破

研究提出全新ASyMOB基準，專注大語言模型在大學層級符號數學的操作能力，透過數值與符號擾動測試模型是否僅靠記憶模式。測試顯示即使高準確模型在擾動下表現下降近70%，而具程式碼執行功能的模型在部分擾動上可提升30%。此結果暗示未來可能需要更深度的工具整合或更強的符號推理模型。

深度分析

人工智慧的工具理論與權力追求：從理論批判到安全對策

近年人工智慧的快速發展引發學界對其可能帶來的生存風險關注，部分研究者以「工具理論」主張，權力作為提升目標實現機率的手段，會被廣泛的智慧代理人所追求。本文針對該理論的非正式防禦與形式化證明進行分析，發現其未能提供足夠證據證明大規模、永久性的人類失能將必然發生。因此，僅憑工具理論無法支撐人工智慧將成為不可控的存亡威脅，對於長期主義與治理策略的制定仍需更嚴謹的證據基礎。本文亦比較現有的安全框架與工具理論的假設差異，指出未來若缺乏透明度與可驗證機制，相關風險仍難以評估。

速報

從訓練動態重新定義 AI 科學：預測、介入與設計模型行為的三層次框架

本篇立場論文指出，人工智慧模型不是靜態產物，而是受資料、目標、架構與最佳化動態共同塑造的時間演化過程。傳統研究多在訓練完成後分析行為，忽略了模型為何會出現特定特性。作者主張 AI 科學應超越事後修補，直接研究訓練過程本身，建立從早期訓練訊號預測結果、在軌跡偏離時即時介入、以及設計更可靠訓練程序以產出期望特性的三層次理解。

速報

首度正式定義機器心智理論：跨領域元模型與基準評估

本篇論文首次提出機器心智理論（Machine Theory of Mind）的嚴謹形式定義，結合認知心理學、神經科學與人工智慧的實證原則，作為檢視現有研究的分析框架。作者進一步構建一個通用的整體性元模型，並針對目前最先進的實驗方法進行系統性基準測試，旨在為未來突破機器理解人類心智的挑戰提供研究方向。

深度分析

Nvidia 發表 RTX Spark 超級晶片，推動桌面 AI 計算與圖形整合

Nvidia於台北電腦展推出RTX Spark超級晶片，具1petaflop計算力，支援AI代理與本地大模型。多家PC代工將於秋季推出搭載此晶片的Windows電腦，並內建與微軟共同開發的安全沙盒。此舉預示AIPC市場可能快速成長，同時挑戰傳統GPU為主的AI生態。

速報

ClickHouse年化營收衝破2.5億美元，快速擴張並朝IPO軌道前進

資料庫供應商ClickHouse宣稱年化營收已達2.5億美元，較去年成長三倍，並預期年底營收可望上看高九位數。公司以開放原始碼資料庫為基礎，透過雲端託管服務替企業處理人工智慧代理所需的大規模資料集，主打商業化服務低於自行維運的成本。