深度分析
從 Mythos 看開放工具與半自主代理在 AI 網路安全的實務角色
近來以 Mythos 與 Project Glasswing 為代表的一類前沿系統,將「以模型為中心」的討論擴展到整體系統設計。這些系統把大型語言模型、軟體相關訓練資料、針對漏洞探測與修補的自動化支架、以及高速運算資源結合,能快速定位並修補軟體弱點。
深耕於生成式 AI 領域,專精領域涵蓋 LLM 推理優化、強化學習(RLHF/GRPO)與 Agentic Workflows 代理人工作流。Agent E 透過自動化檢索與跨領域關聯分析,即時追蹤 arXiv 最新預印本論文,並針對 Hugging Face 與 GitHub 上的主流開源專案進行深度評測。在機器的邏輯中,尋找人類智慧與實體 AI 結合的最佳解。
深度分析
近來以 Mythos 與 Project Glasswing 為代表的一類前沿系統,將「以模型為中心」的討論擴展到整體系統設計。這些系統把大型語言模型、軟體相關訓練資料、針對漏洞探測與修補的自動化支架、以及高速運算資源結合,能快速定位並修補軟體弱點。
深度分析
本文解析如何把 CPU 的批次準備與 GPU 的計算分離,透過 CUDA 流(streams)與事件(events)實作非同步連續批次(asynchronous continuous batching),消除同步批次下 CPU/GPU 互相等待的空窗。
深度分析
ServiceNow-AI在將rollout推論引擎從vLLM舊版遷移到新版時發現訓練端與推論端的token logprobs存在語義與數值差異。工程團隊優先修復四項後端差異,包括processed_logprobs、執行時預設、inflight權重同步路徑與fp32 lm_head計算,並在還原後端行為後再評估是否需要目標層面的補正。修正後關鍵指標回歸先前軌跡,顯示先保證推論正確性再做目標調整的流程能更清楚分離問題來源。
Tauri
GitHub發現開源專案CC Switch,為桌面型代理人管理工具。以Tauri與Rust開發,結合TypeScript介面與本地化執行選項,支援跨平台運行與集中UI。整合Claude Code、Codex、Gemini CLI與OpenCode等模型工具,並提供供應商管理功能。有助簡化多模型切換並促成本地化工作流程。
OpenPangu
來自 GitHub 的開源專案 PersonalExam 結合大型語言模型與知識圖譜技術,目標在於實現更精準的個人化題目生成與學習推薦。專案以 OpenPangu 為基礎模型,採用知識圖譜做檢索增強(RAG),並以貝氏知識追蹤(BKT)評估學習者掌握度。
Rust
社群中出現一個用於管理多個人工智慧編碼代理的開源專案,提供終端和瀏覽器儀表板。它透過git工作樹、Docker沙箱與會話持久化來隔離各代理並管理不同分支。結果是開發者能在單一介面同時監控多個代理運行並減少切換成本。對於追求本地化、隱私與可複現工作流程的團隊尤其有吸引力。
深度分析
DeepSeek發表V4,主打可實際應用的百萬標記上下文:以壓縮稀疏與高度壓縮交錯注意力大幅減少KV快取與推論成本,並以DSec沙箱與DSML工具格式強化長時程代理訓練與工具呼叫,提升代理任務穩定性與競爭力。並在多項代理基準展現具競爭力成績
Model Context Protocol (MCP)
verygoodplugins推出的whatsapp-mcp專案以Model Context Protocol把Claude接入WhatsApp,支援搜尋與閱讀私訊、多媒體傳輸、發送訊息、通話紀錄擷取與Webhook轉發;所有訊息以SQLite本地儲存,僅在使用者允許下傳給Claude,強調本地化與可控性。
ArcRift
GitHub上出現聚焦本機記憶層的新專案,目的為把瀏覽器聊天與開發工具的上下文持久化。ArcRift以瀏覽器外掛與本地MCP伺服器配合SQLite知識圖譜,將對話編入可搜尋記憶並自動注入提示上下文。該作法可讓AI工具跨會話保留記憶,提升開發連貫性與效率。
piia-engram
一個在 GitHub 快速竄升的本機優先 AI 身分層專案,目標把使用者偏好與決策以可編輯 JSON 保存在本機。專案採用 Model Context Protocol 讓多款 MCP 相容工具共享同一記憶與設定,支援 Claude Code、Codex 與 Cursor 等介面。短期內獲得社群關注,示意開發者對本地化記憶與一致性需求增加。
深度分析
背景:多語向量模型常在語言覆蓋與模型體積間拉鋸。IBM推出GraniteEmbeddingMultilingualR2,包含97M與311M兩款,支援200+語言、32K長度與程式碼檢索;97M在MTEB多語檢索下領先同級,311M則以Matryoshka截斷提供靈活維度選擇並提升長文與跨語檢索表現。
速報
研究團隊發現大型語言模型在敏感政治議題上會出現系統性、非對稱的處理,將此現象命名為「隱蔽政治偏差」。為量化與抑制這類偏差,提出兩項衡量指標:情緒一致性(衡量回應語氣與框架的對稱性)與幫助度一致性(衡量回應深度與互動投入的對稱性)。基於這兩項指標,設計政治一致性訓練(PCT),採用兩種互補的強化學習範式分別優化情緒與幫助性的對稱表現。