LoongForge
LoongForge 訓練框架解析:系統化效能優化與 NVIDIA GPU、Kunlun XPU 的異質支援
LoongForge由BaiduBaige推出,是以Megatron‑LM為基礎的模組化訓練框架,涵蓋LLM、VLM與diffusion模型訓練,原生支援NVIDIAGPU與KunlunXPU,開源前在生產部署中宣稱可帶來顯著訓練加速與更佳硬體相容性。
LoongForge
LoongForge由BaiduBaige推出,是以Megatron‑LM為基礎的模組化訓練框架,涵蓋LLM、VLM與diffusion模型訓練,原生支援NVIDIAGPU與KunlunXPU,開源前在生產部署中宣稱可帶來顯著訓練加速與更佳硬體相容性。
Rust
ShepherdModelGateway(SMG)是一個跨引擎的開源LLM入口,支援多種後端與gRPC管線。它引入KV快取感知路由、對話歷史與tokenization快取等做法,能降低延遲並優化資源分配,對企業多租戶部署有實際影響。有助於整合本地與雲端推理。
YantrikDB
在多代理與檢索增強生成(RAG)興起的背景下,yantrikos/yantrikdb-mcp 提供一套可插拔的 MCP(Model Context Protocol)伺服器,讓 Claude Code、Cursor 與 Windsurf 等 MCP 相容客戶端能存取持久化的認知記憶。
GPUStack
GPUStack是一個開源的GPU叢集管理器,目標是簡化高效能人工智慧模型的部署與推論。它支援跨環境、多叢集管理,並可插拔地整合多種高效能推論引擎(例如 vLLM、SGLang、TensorRT‑LLM),以支援 Day‑0 新模型上線。平台提供預調優模式以滿足低延遲或高吞吐需求,並整合延伸的KV快取系統與推測式解碼選項來縮短首標記時間。
claude-skills
在 AI 代理與程式碼自動化快速發展的情境下,claude-skills 提供一套面向多平台的開源技能集合,包含超過三百一十三個可重用的 Claude Code 技能、上百個純標準庫 Python 工具與結構化的 SKILL.md 文件。
ARIS
此開源專案提出以Markdown技能驅動的自動化研究流程,能與ClaudeCode及多款LLM代理整合。它採用跨模型審查迴圈、技能化工作流與實驗自動化的做法,並提供獨立CLI與多種適配說明。該方法旨在加速研究迭代並降低重複性工作對研發效率的影響。
MARM
近年大型語言模型在跨會話記憶與上下文延展上有限。MARM採用MCP原生的持久記憶層、向量語意搜尋與自動分類,並整合SQLite與Docker部署,使多個AI客戶端共享可控記憶,提升跨會話一致性與回溯能力。該專案在GitHub上有289顆星與50個fork,採MIT授權。
Agent Client Protocol (ACP)
研究者與開發者在尋求把AI程式代理整合到日常溝通工具中。OpenACP以AgentClientProtocol為核心,透過自託管橋接讓Telegram、Discord與Slack成為可控制代理的介面。此做法降低對遠端雲端UI的依賴,提升可控性與隱私管理。
聯邦搜尋
Swirl 是一個開源的聯邦搜尋(federated search)專案,主張在原地查詢各種資料來源,並以大型語言模型(LLM)對結果重新排序,而不把原始資料抽取或建立中央索引。
wax
在Apple平台上出現一個以單檔格式實作的本地記憶層,稱作Wax。它以Swift原生儲存文件、嵌入向量與結構化知識,主打混合式文字與向量檢索、極低延遲與零雲端依賴。此做法讓代理人能在裝置端快速召回記憶並維持私有性,對需要本地化RAG的應用具實務吸引力。
SkillDock
SkillDock 是一款針對桌面環境的技能與 MCP 伺服器管理工具,聚焦讓開發團隊可視化、編輯並同步 AI Skills 與 MCP 設定。它支援從 Git 倉庫或技能市集安裝,採用 Git 感知工作流以追蹤上游變更與本地修改,並提供來源分組、工具端啟用狀態與多工具同步。
claude_codex_bridge
在開源社群中出現一款整合多個大型模型與CLI代理的工具,透過單一指令管理啟停、代理互通與專案級團隊配置,讓多代理在同一終端協作並支援角色分工與恢復機制,可能改變本地化AI工作流程與團隊協作模式。對研究者與開發團隊帶來效率與治理的新挑戰,亦促使周邊工具朝可視化監控與合規整合發展。