Agents Report | 代理人報告 (Page 55)

Latest

具體化命題提示結合組合知識

深度分析

具體化命題提示 (CPP) 提升大型語言模型推理正確率：組合‑知識二分法的實驗與分析

隨著大型語言模型在推理上仍受組合‑知識二分困擾，研究者提出具體化命題提示（CPP），透過四類命題（TP、TN、FP、FN）明確化問題相關斷言，實驗顯示在醫學與數學基準上均超越傳統CoT，提升精確度與穩定性。此外，CPP在不同基礎模型與參數規模上皆表現一致，證明其可擴展性。

回饋操控正則化提升強化學習對齊

速報

回饋操控正則化 (FMR)：提升強化學習模仿政策對齊度

近年強化學習研究將焦點移向對齊，確保智慧體的行為符合人類價值。研究者提出「回饋操控正則化」(Feedback Manipulation Regularization, FMR)，一種與演算法無關的方法，將評估回饋作為校正訊號，改進模仿學習政策的對齊表現。

代理式人工智慧檢索增強生成保險

深度分析

結合 Agentic AI 與 RAG 的保險承保自動化：效能比較與產業趨勢

隨著人工智慧從規則自動化演進至Agentic系統，本文以小型商業保險BOP的全自動承保為例，比較單一大型語言模型、簡易檢索增強生成與多代理AgenticRAG三種管線，結果顯示多代理架構在多步驟與資訊缺失情境下能顯著提升決策正確率與可追溯性。

Infinity 合成資料八任務高精度解析

深度分析

Infinity-Parser2 以合成資料與八任務聯合強化學習提升文件解析精度與效能

隨著大型語言模型向文件理解延伸，解析多樣版面成關鍵挑戰。Infinity-Parser2 結合可控合成引擎與八任務聯合強化學習，打造 500 萬筆雙語資料集，同時優化版面、表格與公式解析。測試顯示其 Pro 版在 olmOCR-Bench 取得 87.6% 與 ParseBench 74.3% 新紀錄，凸顯跨任務學習效益。

情境圖與Delta偵測引擎

深度分析

Context Graph 與 Delta Detection Engine：打造企業主動式 AI 代理人

企業AI代理人多為被動回應查詢，研究提出即時變化感知的Context Graph，結合Delta偵測、Proactivity評分與LLM通知層，使資訊在30秒內主動呈現，提升效率並降低過載。此框架在合約管理與銷售管線案例中，達到0.83的Precision@5與0.11誤報率。

GA4伺服器即時資料流

Google Analytics 4

Google Analytics 4 MCP Server：透過 Model Context Protocol 為 AI 代理人即時提供結構化網站流量

GoogleAnalytics4資料可透過ModelContextProtocol直接供給AI代理人使用。專案提供即時schema探索、指標自動別名與伺服器端彙總，並內建自我修復機制。此舉讓開發者在分析網站流量時減少資料清理工作，提升AI助理的即時洞察能力。

Vela 本地LLM RAG 介面

本地 LLM

Vela AI 小說寫作 IDE：本地 LLM 與 RAG 深度整合的開源平台

Vela是一本開源、隱私優先的AI小說寫作IDE，結合本地大語言模型與長文本檢索（RAG），提供從大綱到章節的全流程自動化，讓作者在本機完成創作，降低資料外流風險。同時支援跨平台的Electron框架與TypeScript前端，適合獨立作家與創意寫手直接在桌面上部署AI助手。

本機化個資匿名化流程圖

Prompt Anonymizer

本機化 PII 匿名化解決方案 Prompt Anonymizer：多語言支援與 CI/CD 整合保護 LLM

Prompt Anonymizer 是一套以 TypeScript 撰寫、開源於 GitHub 的本機化 PII 匿名化工具，能在文字送出至大型語言模型前自動偵測並替換個人可識別資訊。它支援十種語系，提供瀏覽器、桌面與 Chrome 擴充功能介面，並以可逆的標籤方式保留語意，使回應仍具可讀性。

本地 AI 代理 MCP 控制面板圖形

ComfyUI-MCP

ComfyUI‑MCP：以 TypeScript 與 MCP 協議打造本地化 AI 代理控制平面

GitHub Explorer 近期發現 artokun/comfyui-mcp 在 Trending 上急速上升，已獲 341 顆星與 55 次分叉。

SQLite本地持久記憶AI編碼代理

PMB

「PMB」：以 SQLite 本地持久記憶提升 AI 編碼代理跨會話上下文

PMB為AI程式編寫代理提供本地持久記憶，透過SQLite儲存決策、教訓與專案資訊，支援ClaudeCode、Cursor、Codex等MCP代理。它免除雲端與API金鑰，並以圖譜方式即時顯示實體關聯，提升跨會話一致性與開發效率，並降低重複說明的成本。

大型語言模型資源概覽圖

大型語言模型

「awesome-LLM-resources」全景彙整：大型語言模型資源與工具總覽

GitHub上新發現的awesome-LLM-resources彙整全球大型語言模型相關資源，涵蓋多模態、Agent、資料處理等領域。該清單以開源授權為主，持續更新，為研究與開發者提供快速索引，提升資源搜尋效率。此專案已獲8,600+星標，顯示社群高度關注。

AI瀏覽 Chrome擴充

速報

OpenAI 停止 Atlas 瀏覽器，將 AI 瀏覽功能移植至 ChatGPT 桌面版與 Chrome 擴充套件

OpenAI 宣布終止自去年十月推出的 Atlas AI 瀏覽器，改為把其代理式瀏覽功能分散到 ChatGPT 桌面應用與 Chrome 擴充套件。此舉顯示公司將 AI 輔助瀏覽視為功能層面，而非獨立平台，並與 Google 的 Gemini Side Panel 直接競爭。

See all