主動學習 - Agents Report

速報

以互動式世界模型驅動的具身 AI 新方向：從神經迴路到自主學習

近期生成式與具身人工智慧的突破，多仰賴大規模多模態預測學習，但仍以被動訓練為主，語言規則作為資訊骨架。神經科學與認知科學則指出，生物智慧的語意結構是由與環境互動形成的具體世界模型支撐，語言才附著其上。

深度分析

AI 設計模式的系統化調查：結合 LLM 文獻萃取與 GitHub 主動學習驗證

隨著大型語言模型的崛起，AI 應用程式的設計模式成為提升品質的關鍵。研究團隊先從 44 份文獻中萃取 14 種 AI 設計模式，並以詞向量聚類細分為 78 個候選，再手動精煉成最終類別。

高斯過程回歸

AB-SID-iVAR：以高斯過程應對自誘導玻茲曼分布下的主動學習

本研究探討一類特殊的主動學習問題：目標分布由未知函數自誘導成玻茲曼形式，常見於分子勢能面與自由能估算等科學應用。論文提出 AB-SID-iVAR，一種基於高斯程序的採樣準則，可近似不可解的貝葉斯目標分布而免去分配函數估計，並同時適用於離散與連續輸入域；

深度分析

Chain-of-Thought（CoT）在多源推理中的可學習性與主動查詢策略

自回歸生成與思維鏈為大型語言模型的推理核心。研究聚焦多位正確但步驟不同的思考者提供CoT時的學習可行性與難度。論文證明：在某些密碼學假設下，被動收集CoT即使來自兩位思考者也可能使學習變困難；但若採主動查詢，對每位思考者僅需少量CoT並配足夠最終答案資料，則可在計算上達成有效學習。

速報

大型語言模型輔助成員查詢：以反概念驗證本體學習

在主動學習中成員查詢允許學習者向教師提出是非命題以驗證本體涵蓋性。本研究將候選公理重寫為對應反概念並以受控自然語言表述，再交由大型語言模型提供近似實例作為反例近似。實驗使用十三款商用大型語言模型於多個既有本體，結果顯示僅會出現第二類錯誤，召回率保持穩定且主要影響為延緩建模流程。

深度分析

TableNet：LLM 驅動的自主表格生成與辨識多代理系統

TableNet 針對表格結構辨識缺乏大規模高品質資料的問題，提出 LLM 自主生成與辨識多代理系統，能控制視覺、結構與語意參數產出多樣表格影像。辨識部分採多樣性主動學習，選取最具資訊量樣本微調模型，顯著減少訓練樣本且提升實務表格辨識效能。

深度分析

大型語言模型好奇心評估：5DCR量表揭示求知慾與推理提升

本研究以五維好奇心量表為基礎，打造評估框架測試大型語言模型的好奇心。結果顯示LLM在資訊尋求上比人類更渴求知識，但在不確定環境中仍偏保守。研究進一步證實，好奇行為能提升模型的推理與主動學習能力，暗示未來LLM有望具備類似人類的好奇驅動學習機制。

AI 輔助篩選

TiAb Review Plugin：Chrome 瀏覽器即插即用的 AI 輔助系統性文獻篩選工具

背景：傳統篩選工具需付費或具程式能力。技術：TiAb Review Plugin 以 Chrome 擴充、Google Sheets 與 Gemini API 提供無碼、無伺服器的 AI 篩選，支援手動、LLM 批次與 ML 主動學習。結果：在六組資料集上分類結果與原始相同，召回率達 94%~100%，工作節省最高 87%。