速報
大型語言模型與安全困境實驗:用AI重現國際關係策略機制
研究以大型語言模型為實驗對象,在重複安全困境中檢驗多極化、有限時間視野與通訊可否重現國際關係的典型機制;方法透明可複製;結果顯示多極化提升衝突可能、有限視野導致逆向推理下的瓦解,通訊則透過示警與互惠降低衝突。並能觀察模型內部推理與公開訊息。
速報
研究以大型語言模型為實驗對象,在重複安全困境中檢驗多極化、有限時間視野與通訊可否重現國際關係的典型機制;方法透明可複製;結果顯示多極化提升衝突可能、有限視野導致逆向推理下的瓦解,通訊則透過示警與互惠降低衝突。並能觀察模型內部推理與公開訊息。
速報
研究指出在固定教師(transformer)框架下,線上查詢編碼成為主要成本。提出KernelAffíneHullMachines(KAHMs),在RKHS估計原型混合權重並以正規化最小均方精修原型,將詞彙特徵映射到凍結語意空間。實驗顯示能重建教師空間並降低查詢延遲。
速報
具身人工智慧將感知、認知、規劃與互動整合於能在實體世界行動的代理人,面對不確定感測、不完全知識與動態人機互動,安全風險更直接且關鍵。本綜述系統化檢視超過400篇研究,提出多層次分類法,回顧從感知、認知到規劃與行動的攻擊與防禦,包括對抗、後門、越獄與硬體層面,並整理偵測、安全訓練、穩健推論與風險感知互動等防護策略。
速報
ArXiv 團隊透過 Fitbit 應用部署 SymptomAI,讓 13,917 名真實穿戴裝置使用者隨機與五款對話式代理人互動,取得日常症狀對話與疾病分布。1,228 人回報臨床診斷,517 筆對話由臨床小組耗時評註。
速報
研究團隊提出「Agentic-imodels」,一個能自動演化、供人工智慧代理讀取與模擬的資料科學工具循環。系統生成一組與 scikit-learn 相容的回歸器,並同時優化預測效能與以大型語言模型(LLM)評分的「代理可解釋性」指標。該指標透過一系列 LLM 測試驗證模型文字化描述是否可被 LLM 單靠文字模擬行為。
速報
大型語言模型從靜態生成走向實務決策支援。OracleProto建構可重現評估框架,將已解事件還原為具時間界限的預測樣本,採用截止對齊、時間遮蔽與洩漏偵測等措施。實驗於FutureX-Past衍生資料集與六款模型上執行,將殘餘洩漏降至1%等級,並提供可審計的跨模型比較介面。
速報
DaoCloud推出Enterprise5.0文件倉庫,聚焦Kubernetes生態與文件治理。內容以MkDocs撰寫並以GitOps與PR流程控管,支援多個Kubernetes版本。貢獻步驟含Fork、clone、修改、本地預覽與PR送審,強化文件可維護性與社群協作。
速報
一款名為mcpbr的開源工具,主打用真實GitHub Issues模擬負載來為MCP伺服器做基準測試。它採用Model Context Protocol(模型上下文協定)測試流程,透過簡單指令執行並產生詳細效能報告,支援跨平台。此方法能讓開發與運維更準確評估伺服器在實務情境下的表現與差異。
速報
在開源平台發現一個聚焦特定人工智慧平台的開源範本庫,收錄可用於軟體即服務的設計範例與應用程式介面文件。專案透過平台介面與模板化流程,協助開發者快速建立人工智慧應用並簡化原型部署。此資源具社群參與與實作導向,利於加速產品驗證與原型迭代。對於想快速驗證人工智慧概念的團隊是實用資源。
速報
Anthropic在GitHub提供一個skills倉庫示範AgentSkills讓Claude載入專門任務模組。Skills以資料夾與說明檔組織,涵蓋創意、技術與企業流程。部分範例採開源授權,另有文件產製工具為來源可用但非開源。提供開發者實作參考。
速報
在 GitHub 上發現一個高品質開源專案 Chinese-Word-Vectors,收錄超過一百組預訓練中文詞向量,包含密集向量與稀疏向量,並支援詞、ngram、字等多種表示與語境特徵。專案同時提供中文類比推理資料集 CA8 與評測工具,便於研究者比較內在與外在評估表現。
速報
迷因結合影像、文字與文化脈絡成為主要溝通與操弄媒介。研究提出MemeLens──一個統一的多語、多任務、附解釋的視覺語言模型,整合38個公開迷因資料集並統一為20項任務。實驗顯示:有效理解迷因需多模態訓練,語義類別差異大,且單一資料集微調易導致過度專精。