速報
遞迴語言模型循環的持久定向:上下文更新規則如何決定逃逸與持續性
本研究檢視遞迴語言模型循環被外部注入文本重定向的持久性。比較append、replace與dialog三種上下文更新規則,在12,000字尾截斷條件下,目的地一致性持續率約16%,來源逃逸保留約36%;在完整歷史協定下,來源逃逸於約400token越過50%,至1,500token飽和至75–80%。
速報
本研究檢視遞迴語言模型循環被外部注入文本重定向的持久性。比較append、replace與dialog三種上下文更新規則,在12,000字尾截斷條件下,目的地一致性持續率約16%,來源逃逸保留約36%;在完整歷史協定下,來源逃逸於約400token越過50%,至1,500token飽和至75–80%。
速報
科學研究流程自動化持續躍進。NORA提出一套為地理資訊科學與空間資料科學量身設計的多代理人系統。系統以harness工程化架構整合領域專屬技能、子代理與MCP伺服器,並具備專門的空間分析與空間資料下載技能。評估指出,此領域專門化架構在效率與研究品質上優於通用代理。
速報
模型請求在實際服務中會經過版本別名、服務分級、工具選擇與區域端點等多重路徑,這些運行時路徑會影響成本、品質與責任歸屬。論文提出「路由收據」概念,將每次回應的執行路徑以緊湊紀錄形式保存,記錄關鍵事實以便重構路由決策,同時透過遮蔽機制保護專有內部細節。
速報
將自然語言問題自動轉成約束式程式模型長期是瓶頸。CP-SynC 提出一套多代理零樣本建模流程:建模代理生成並精煉 MiniZinc 候選模型,驗證代理合成語義檢核器以提供回饋;系統並行探索多條建模路徑,最後以證據聚合挑選最終模型。
速報
部分自動駕駛會增加駕駛認知負擔。本研究提出Mediator-in-the-Loop-Driving(MILD),以代理人架構整合座艙與車外感知,並由輕量策略代理人提出可解釋建議,採Evidence-and-Constraint-weightedPolicyOptimization(ECPO)及檢驗器與檢索增強模組強化決策。實驗於三個公開資料集顯示MILD於可稽核指標與人類評分上優於基線。
速報
GitHub Explorer 揭露開源專案 AILinkX,定位為以人工智慧為核心的數位生活作業系統。它結合視覺感知、情感運算與多代理人相容,並標榜自治任務管理與記憶視覺化;專案涉獵本地 LLM、RAG 與 WeChat 整合,對個人工作流程與通訊自動化具影響力。
速報
本報導揭露一個整合多款人工智慧模型與系統提示的開源專案,定位為開發者工具箱。專案收錄各式模型與預置提示範本,並提供跨平臺下載與安裝指引,主打簡化prompt工程與代理人建置流程,務求加速測試與迭代並提升開發效率。同時鼓勵社群討論與貢獻,方便共享提示策略與實務經驗。
速報
近日出現開源專案github-to-mcp,旨在將GitHub倉庫快速轉為MCP伺服器。它以TypeScript與AI代碼生成功能從OpenAPI、GraphQL與REST抽取工具並生成型別安全的TypeScript與Python服務。該工具能讓AI助理直接存取專案代碼與API以便分析與互動。
速報
Memoria 是一個在 GitHub 出現的開源專案,主張將類 Git 的版本控制應用到 AI 代理的記憶層。專案提供快照、分支、合併與回溯功能,並結合向量與全文混合檢索以語意索引記憶。系統內建矛盾偵測、隔離低信度項與完整稽核鍊,並支援本地嵌入模型以優先保護資料隱私。
速報
在GitHub發現一個結合Claude語言模型與MetaTrader5的多標的自動交易專案。專案由多個專責Claude代理人協作,分工處理技術面、基本面與風控,並以即時介面流式呈現決策、倉位與損益;設置硬性守門以抑制失控交易,對量化與AI研究具實驗價值。
速報
kbot 是一款以終端為主的開源人工智慧代理,強調避免供應商鎖定並支援本地離線運行與多家模型供應商。專案整合 35 個專家代理與超過 600 種工具,並支援 20 家供應商,提供程式庫 API 與內建 MCP 伺服器,能接入編輯器或工具鏈。
速報
彭博報導指出,蘋果計畫在下一次系統更新中,允許第三方人工智慧模型以擴充形式整合進系統的智慧功能。使用者可安裝支援的人工智慧應用並在系統設定中選擇預設模型;這些第三方擴充將能驅動Siri回應、寫作工具與影像編輯等功能。此舉可能改變系統層AI的供應與使用者選擇。