GoModel
GoModel:跨平台 Go 語言 AI Gateway,整合 OpenAI、Anthropic、Gemini 等多家模型
GitHub Explorer 探索到的 GoModel 是一套以 Go 語言實作的 AI Gateway,提供統一的 OpenAI 相容 API,能同時串接 OpenAI、Anthropic、Gemini、DeepSeek、xAI、Groq、OpenRouter、Z.ai、Azure OpenAI、Oracle、Ollama 等多家大型。
GoModel
GitHub Explorer 探索到的 GoModel 是一套以 Go 語言實作的 AI Gateway,提供統一的 OpenAI 相容 API,能同時串接 OpenAI、Anthropic、Gemini、DeepSeek、xAI、Groq、OpenRouter、Z.ai、Azure OpenAI、Oracle、Ollama 等多家大型。
Proma
Proma以本地優先設計,結合多模型聊天、通用Agent與Skills,支援飛書、釘釘等企業機器人。全端資料預設存於~/.proma,採用AGPL-3.0授權,允許自行部署與客製化。Skill與MCP可自行編寫,支援遠端飛書、微信機器人橋接,實現跨平台協作。
速報
研究團隊提出 Consilium Protocol,一套源自拜占庭容錯的架構,讓多模型 AI 在討論時將模型間的分歧視為認知訊號而非錯誤。透過為語言模型分配工程化的認知人格,並引入量化金融的樣本內/樣本外驗證機制,能區分訓練資料的共識與實證結論。
Repomix
Repomix 是一款將整個程式碼庫壓縮成單一AI友善檔案的開源工具,支援多種大型語言模型如 Claude、ChatGPT、Gemini 等。它透過TypeScript打包,可直接供模型進行分析與生成,降低前置資料處理成本,提升開發效率。它支援 Windows、macOS、Linux,採 MIT 授權,促進社群貢獻。
大佬動態
NVIDIA 於今日發表 Cosmos 3,採用 Mixture-of-Transformers 結合自回歸推理與擴散生成,支援語言、影像、影片、音訊與動作。核心 Nano 模型以 16 億參數分割為推理塔與生成器兩部份。此發布顯示 NVIDIA 在多模態 AI 整合上取得關鍵進展,將促進跨領域應用的開發與部署。
深度分析
OpenAI於HuggingFaceHub發布開源PrivacyFilter,能在128k上下文一次前向傳遞標記八類個資。結合GradioServer以排隊端點提供文件、影像與貼文三種即時去識別工具,提升開發者部署效率並降低資安治理成本。與隱私保護。
速報
ELSAKKK 開源的 Mnemos-MCP 近期在 GitHub Trending 上快速攀升,吸引開發者注意。這是一套以 Python 撰寫的私有知識伺服器,提供多集合隔離、決定性匯入與本地向量搜尋等功能,讓文件可在本機安全且高效地被索引與查詢。
深度分析
Nvidia於台北電腦展推出RTX Spark超級晶片,具1petaflop計算力,支援AI代理與本地大模型。多家PC代工將於秋季推出搭載此晶片的Windows電腦,並內建與微軟共同開發的安全沙盒。此舉預示AIPC市場可能快速成長,同時挑戰傳統GPU為主的AI生態。
深度分析
PaddleOCR3.5讓OCR與文件解析可直接使用HuggingFaceTransformers後端。只要把engine設為transformers,即可在PyTorch生態中呼叫PP‑OCRv5、PaddleOCR‑VL1.5等模型。此舉降低文件到LLM流程的整合摩擦,提升開發效率。
深度分析
隨著AI代理快速發展,術語混用成為新手障礙。本文釐清模型、Scaffold、Harness、Agent等概念,說明它們在訓練與推論中的角色與差異,並指出統一詞彙有助於跨框架合作與降低開發成本,此術語統整將促進工具生態互通,並降低因實作差異產生的維護負擔。
深度分析
NVIDIA 在 2026 年推出首個開放式全能物理 AI 模型 Cosmos 3,採用 Mixture‑of‑Transformers 架構,支援文字、影像、影片與動作多模態,提供 Nano 與 Super 兩種規模。模型可直接生成符合物理規則的合成影片,並搭配多套合成資料集,助於機器人與自駕等應用。此舉結合先前 Orin 衛星在軌運算實驗,顯示全域模型在即時資料處理與太空計算的潛力。
深度分析
JetBrains 於 2026 年 6 月發表 Mellum2,這是一款 12 億參數的 Mixture-of-Experts(MoE)模型,專為文字與程式碼工作負載設計。模型在每個 token 只激活約 2.5 億參數,實現超過同規模開源模型兩倍的推理速度,適用於路由、RAG、子代理與私有部署等高頻 AI 任務。