深度分析
Anthropic 被指削弱 Claude Opus 4.6 與 Claude Code 效能,引發 AI 社群熱議
開發者指 Anthropic 最近削弱 Claude Opus 4.6 與 Claude Code,稱其推理深度下降、任務中斷與幻覺增多。Anthropic 回應稱變更為 UI 與預設運算力度調整,非模型降級,並提供手動提升運算力度的指令。此爭議凸顯使用者對模型效能與資源管理的信任危機,可能影響 AI 代理市場競爭格局。
深度分析
開發者指 Anthropic 最近削弱 Claude Opus 4.6 與 Claude Code,稱其推理深度下降、任務中斷與幻覺增多。Anthropic 回應稱變更為 UI 與預設運算力度調整,非模型降級,並提供手動提升運算力度的指令。此爭議凸顯使用者對模型效能與資源管理的信任危機,可能影響 AI 代理市場競爭格局。
深度分析
微軟正測試將 OpenClaw 風格的 AI 代理整合至 365 Copilot,使其成為全天候執行任務的助理。微軟企業副總裁 Omar Shahine 表示,將針對行銷、銷售與會計等角色設計權限受限的代理,降低安全風險。此功能預計於 6 月 Build 大會亮相,可能重塑企業 AI 生態。
深度分析
MiniMax 針對 AI 代理缺乏多媒體生成能力的痛點,推出 MMX-CLI 指令列介面,將文字、影像、影片、語音、音樂、視覺與搜尋七大生成模態封裝為 shell 命令,免除 Model Context Protocol 整合。指令支援模型選擇、參數調整與非同步執行,並提供認證與配額管理。此舉將大幅降低代理開發門檻,促進多模態 AI 應用的快速落地。
深度分析
研究背景:現有基準忽略智慧代理在資訊不足時的求助判斷。核心做法:HiL‑Bench 以人驗證的缺資訊阻斷項測試,並以 Ask‑F1 衡量提問精度與召回率。主要結果:大型模型在缺資訊情境下表現大幅下降,且透過 Ask‑F1 強化學習微調可提升求助品質與跨領域通過率。
深度分析
本篇報導介紹在本機環境建置 OpenClaw 代理執行階段的完整流程,說明如何透過本地閘道、環境變數驗證模型存取,並自訂 RAG 技能與受控 exec 工具,最終實現安全且可重複的代理運作。
OpenClaw
Anthropic 限制 Claude 模型存取,導致 OpenClaw 代理中斷。可透過 Hugging Face 推理服務或本機 Llama.cpp 部署開源模型復原。選擇雲端服務可快速恢復,使用本地模型則保證隱私與零成本。