開放權重模型 - Agents Report

深度分析

ThinkingMachinesLab於2025年成立，發布開放權重模型Inkling，使用NvidiaGB300晶片在Google雲端訓練，擁有9750億參數，能同時理解音視訊與文字並支援程式碼生成，預計將推動AI開源生態與本地供應鏈需求。

深度分析

2026 年記憶體價格飆升與開放權重模型崛起同時改寫 AI 基礎建設格局。研究指出，雖然 GLM‑5.2 等開源大模型降低服務成本，但記憶體溢價使既有廠商持續掌握成本優勢。結果顯示，若代幣需求年增 2 倍，業者仍能維持資金安全，否則新進者面臨高失敗風險。

深度分析

WorkBench基準評估工作代理人效能與安全。2026年以ClaudeOpus4.8完成89%任務，意外有害行為降至2.5%。顯示模型在能力與安全上同步提升，且開源模型成本大幅下降。從43%任務完成率提升至89%，有害行為從26%降至2.5%，同時開放權重模型使每次測試成本降低超過十倍。

深度分析

中國新創Z.ai推出7530億參數的開放權重大語言模型GLM-5.2，具備1百萬token上下文與IndexShare架構，顯著降低運算成本。測試顯示其在長階段軟體工程與工具使用上超越多數封閉模型，可能重塑企業AI部署與開源生態，加速研發與成本效益。

深度分析

本研究以丹麥庇護裁決文本建立RAB‑Cred資料集，測試以開放權重的大型語言模型（LLM）做零樣本與少樣本註記。研究比對多款模型與多種提示，並分析錯誤類型與一致性。結果指出LLM具成本優勢但標註不穩定，建議採用模型或提示混合集成與人類覆核。可供後續研究採用。

深度分析

本研究針對程式教育中的學生行為模擬，提出將真實的程式提交與測試回饋序列化為對話式資料，以訓練開放權重的程式學習者模型。方法結合監督式微調與偏好最佳化，使 4B/8B Qwen 模型在模擬除錯行為上優於僅程式碼或大型封閉模型的基線，提升功能對齊與程式碼相似度。