LLM - Agents Report | 代理人報告 (Page 2)

深度分析

VbR（Variability by Regeneration）— LLM 驅動的 AI 生成軟體產品線新策略

研究指出，AI生成的程式碼在產出時已決定所有變異，提出「變異再生(VbR)」以規格驅動生成多個無死碼二進位，並以分派器動態選擇，預示產品線管理將從程式碼轉向規格。此方法對比傳統以預處理指令或變異點的產品線，將變異完全外部化，未來或促進 AI 驅動的軟體生態更快迭代與驗證。

LLM 加速 PostgreSQL 與 MySQL Arrow 資料批次效能讀取

深度分析

LLM 生成 Apache Arrow 讀取器：PostgreSQL 與 MySQL 資料庫加速最高 27 倍

傳統分析工作負載必須透過JDBC/ODBC走線，造成高延遲。研究提出Jailbreak，利用大型語言模型自動合成可直接讀取PostgreSQL與MySQL儲存檔的欄位緩衝讀取器，輸出ApacheArrow。實驗顯示在多種分析引擎上可提升27倍效能，證明LLM輔助的存儲層解耦能突破資料鎖定。

深度分析

AISIX AI Gateway：Rust 原生、支援 OpenAI 兼容多家 LLM 供應商的全平台代理

AISIX以Rust打造開源AIGateway，提供兼容OpenAI的單一API，整合多家LLM供應商，支援路由、速率限制與內容防護，讓平台可自行部署或使用雲端管理，降低成本並提升治理效能。同時內建快取、觀測與安全防線，支援SSE串流與多模態輸入，適用企業與開發者快速建置多雲LLM架構。

深度分析

利用 GSPO 強化學習提升 LLM 生成 BPMN 流程的語法與語意品質

大型語言模型（LLM）已能從自然語言敘述產出 BPMN 流程圖，但僅靠監督微調（SFT）會受限於訓練資料的模式。研究以 Group Sequence Policy Optimization（GSPO）結合 38 項自動化指標，對 Llama 3.1 8B 與 Qwen 2.5 14B 兩大模型進行 48 種獎勵配置的實驗。

深度分析

TOFFEE：結合蒙特卡羅樹搜尋與預算感知模型的高品質資料代理人軌跡合成系統

隨著大型語言模型驅動的資料代理人在企業環境中應用日增，現有系統難以跨資料庫泛化。研究提出TOFFEE系統，結合蒙特卡羅樹搜尋與自適應模型選擇，能在限定預算下自動合成高品質的多步驟分析軌跡。實驗顯示合成軌跡可提升微調與示範學習效能，超越現有基線。

VulnClaw

AI 驅動的開源滲透測試工具 VulnClaw：支援 13 大 LLM、MCP 多工具鏈全流程自動化

VulnClaw以LLM結合ModelContextProtocol，支援多家模型與21種滲透Skill，能自動完成資訊收集、漏洞偵測、利用驗證與報告產出，近期在GitHubTrending爆紅，提升授權測試與教學效率。同時提供本地WebUI與Python程式碼執行，適用於紅隊演練與資安教學。

Zero

「Zero」開源終端 AI 編碼代理：支援 25+ LLM、完整本地沙箱與腳本化 CLI

隨著 AI 編碼工具普及，開發者對模型選擇權與資料隱私的需求增加。開源專案 Zero 提供一套本地終端代理框架，支援超過 25 種 LLM 提供者，並透過沙箱政策與權限管理確保本地端操作安全。該工具整合 TUI 介面與可腳本化指令，並支援 MCP 伺服器擴展，讓開發者能以低門檻方式建立私有且可控的 AI 編碼工作流。

Patina

開源工具 Patina 運用確定性模式比對，去除 AI 腔調讓生成文本人性化

針對 AI 生成文本中常見的機械化口吻，開源專案 Patina 在 GitHub 快速竄升。該工具採用確定性的模式比對機制，偵測 AI 特有的包裝語句並在不改變原始數據與因果關係的前提下進行重寫。Patina 支援中英韓日四國語言，可整合至 Claude Code 與 Cursor 等 AI 代理工具中，為開發者提供可審計且保留原意的人性化寫作方案。

深度分析

大語言模型（LLM）中的集體經驗主義與偽理性認知：風險與實踐審計對策

隨著大語言模型被廣泛用於知識獲取與自動化，使用者傾向於直接獲取結構化答案而跳過實踐過程。本研究提出「集體經驗主義」與「偽理性認知」概念，分析 AI 如何將人類經驗壓縮成看似理性的輸出，導致使用者產生理解的錯覺。文中建議建立實踐審計框架，透過驗證與反向質詢將 AI 產出回歸實踐，以避免認知迴圈與記憶污染風險。

深度分析

受限代理人框架結合 LLM 與 Airflow：六類收集器的安全可靠資料收集方案

隨著公開網站資料需求激增，傳統手工爬蟲成本高且難以重用。本研究提出六類收集器、模板與JSONSchema限制的代理框架，結合Airflow排程與規則品質檢查，將LLM輸出轉為可驗證配置。實驗於80個驗證任務達成零執行階段LLM令牌、最短牆時延，證明此法適合低成本、可重複的開放資料收集。

RTK

RTK：使用 Rust 打造的 CLI 代理，減少 60%‑90% LLM Token 消耗

RTK（Rust Token Killer）是一套以單一 Rust 可執行檔實作的 CLI 代理，能在指令輸出送入大型語言模型前自動過濾與壓縮，減少 60%~90% 的 Token 使用。官方列出超過 100 種常見開發指令，測試顯示整體 Token 消耗約下降八成，對開發成本與回應速度都有明顯正面效益。

深度分析

硬體感知的 Speculative Decoding 優化：SMART 框架在多模態與大型語言模型上提升推論速度

隨著自回歸生成成為AI生成的核心，傳統的逐字解碼速度受限。研究提出SMART框架，於推論時以硬體感知的邊際效益‑成本比決定是否擴展草稿樹，避免因樹太大而產生負加速。實驗顯示在多款MLLM與LLM上，平均可提升15%至20%的實際運算速度。對部署成本亦有顯著降低。