高斯過程回歸
AB-SID-iVAR:以高斯過程應對自誘導玻茲曼分布下的主動學習
本研究探討一類特殊的主動學習問題:目標分布由未知函數自誘導成玻茲曼形式,常見於分子勢能面與自由能估算等科學應用。論文提出 AB-SID-iVAR,一種基於高斯程序的採樣準則,可近似不可解的貝葉斯目標分布而免去分配函數估計,並同時適用於離散與連續輸入域;
高斯過程回歸
本研究探討一類特殊的主動學習問題:目標分布由未知函數自誘導成玻茲曼形式,常見於分子勢能面與自由能估算等科學應用。論文提出 AB-SID-iVAR,一種基於高斯程序的採樣準則,可近似不可解的貝葉斯目標分布而免去分配函數估計,並同時適用於離散與連續輸入域;
深度分析
自回歸生成與思維鏈為大型語言模型的推理核心。研究聚焦多位正確但步驟不同的思考者提供CoT時的學習可行性與難度。論文證明:在某些密碼學假設下,被動收集CoT即使來自兩位思考者也可能使學習變困難;但若採主動查詢,對每位思考者僅需少量CoT並配足夠最終答案資料,則可在計算上達成有效學習。
速報
在主動學習中成員查詢允許學習者向教師提出是非命題以驗證本體涵蓋性。本研究將候選公理重寫為對應反概念並以受控自然語言表述,再交由大型語言模型提供近似實例作為反例近似。實驗使用十三款商用大型語言模型於多個既有本體,結果顯示僅會出現第二類錯誤,召回率保持穩定且主要影響為延緩建模流程。
深度分析
TableNet 針對表格結構辨識缺乏大規模高品質資料的問題,提出 LLM 自主生成與辨識多代理系統,能控制視覺、結構與語意參數產出多樣表格影像。辨識部分採多樣性主動學習,選取最具資訊量樣本微調模型,顯著減少訓練樣本且提升實務表格辨識效能。
深度分析
本研究以五維好奇心量表為基礎,打造評估框架測試大型語言模型的好奇心。結果顯示LLM在資訊尋求上比人類更渴求知識,但在不確定環境中仍偏保守。研究進一步證實,好奇行為能提升模型的推理與主動學習能力,暗示未來LLM有望具備類似人類的好奇驅動學習機制。
AI 輔助篩選
背景:傳統篩選工具需付費或具程式能力。技術:TiAb Review Plugin 以 Chrome 擴充、Google Sheets 與 Gemini API 提供無碼、無伺服器的 AI 篩選,支援手動、LLM 批次與 ML 主動學習。結果:在六組資料集上分類結果與原始相同,召回率達 94%~100%,工作節省最高 87%。