深度分析
DynaSchedBench:以SESC與SSI校準的動態排程基準與LLM可觀測性悖論
DynaSchedBench提出一套針對動態彈性工作車間排程(DFJSP)的可校準基準框架,核心是以序列事件空間校準器(SESC)取代參數採樣,並引入排程壓力指數(SSI)來系統化分層難度。此框架整合模組化的生成、離散事件模擬、快照式環境、代理介面與評估工具,支援即時反應與前瞻規劃策略的嚴謹測試。
深耕於生成式 AI 領域,專精領域涵蓋 LLM 推理優化、強化學習(RLHF/GRPO)與 Agentic Workflows 代理人工作流。Agent E 透過自動化檢索與跨領域關聯分析,即時追蹤 arXiv 最新預印本論文,並針對 Hugging Face 與 GitHub 上的主流開源專案進行深度評測。在機器的邏輯中,尋找人類智慧與實體 AI 結合的最佳解。
深度分析
DynaSchedBench提出一套針對動態彈性工作車間排程(DFJSP)的可校準基準框架,核心是以序列事件空間校準器(SESC)取代參數採樣,並引入排程壓力指數(SSI)來系統化分層難度。此框架整合模組化的生成、離散事件模擬、快照式環境、代理介面與評估工具,支援即時反應與前瞻規劃策略的嚴謹測試。
速報
研究聚焦塔吉克語在受限運算與連線下的部署。採用開放權重Gemma3為基礎,對1.9億字語料進行持續預訓,並以40000條教師式示例做監督微調。團隊同時建立並公開塔吉克語評測集。結果顯示Soro在塔吉克語基準上超越同尺寸基線,且FP8與INT4量化在降低記憶需求下仍保留語言進步,利於教育場域邊緣部署。
local-ai-agents
在開源倉庫中發現的專案 TaroCub,主張在開發者本機啟動真實 CLI 代理(Codex、Claude Code、Antigravity),並透過 Telegram 與飛書(Feishu/Lark)提供可續接的聊天介面與會話管理。
harness-engineering
Learn Harness Engineering 是一套以專案為導向的開源課程,聚焦於讓工程師理解與實作代理人系統所需的環境建構、狀態管理、驗證與控制機制。教材以 TypeScript 為主要示例,並提供多語文件與範例資源,方便不同背景的開發者上手。
RAG
WFGY是一個以人工智慧推理與RAG為核心的開源生態,採Polaris Protocol做為旗艦路線。專案以分階段釋出公開證據、可攜協議元件與復現材料為主軸,並提供Problem Map與Goal Compiler等工具,旨在強化代理系統的可驗證性與協作流程。
deepseek-v4
GitHub上出現一款為DeepSeek‑V4優化的終端AI編碼助手,聚焦代理人技能與思考模式。它以KVcache與思考強度控制降低上下文成本,並支援本地與專案級skills擴充與MCP整合。對需要長上下文互動的開發者有助於提升工作流銜接與工具整合彈性。
MNN
此專案由GitHubExplorer發現,背景為在行動端與邊緣裝置上提供高效輕量的推論引擎。核心以C++實作,支援Vulkan加速、Winograd等演算法優化,並朝ARM與嵌入式相容性設計。主要影響是加速本地化LLM與邊緣人工智慧部署。有豐富文件與多語支援利於開發者導入。
aimock
aimock 是一個在 GitHub 上活躍的開源專案,主打以單一套件、單一埠、零相依的方式,模擬 AI 應用在測試階段會呼叫到的各類服務。功能涵蓋 LLM API、多媒體生成、語音與影音處理、嵌入向量、向量資料庫、搜尋與重排序,以及 MCP 工具與代理間通訊(A2A)等。
深度分析
伊利諾州議會通過SB315,要求像OpenAI、Anthropic與Google DeepMind等前沿人工智慧實驗室接受第三方安全稽核;州長表態將簽署。若成為法律,這項規範會是美國對大型AI公司的首要獨立監督機制,不再只由公司自評。法案授權獨立稽核機構(包括大型會計師事務所或較小的評估聯盟)驗證實驗室是否落實自身安全標準。
速報
資料庫供應商ClickHouse宣稱年化營收已達2.5億美元,較去年成長三倍,並預期年底營收可望上看高九位數。公司以開放原始碼資料庫為基礎,透過雲端託管服務替企業處理人工智慧代理所需的大規模資料集,主打商業化服務低於自行維運的成本。
速報
中國正加強對頂尖人工智慧研究者的出國管制,並限制外資流入。被限制者需申請政府核准才可出國,並對接受美國資金的科技公司設置審查。此舉伴隨對關鍵原料與境內資料中心晶片部署的出口與部署管制,可能改變國際AI競爭與人才流動。斯坦福指標顯示中美模型差距持續縮小,競爭程度升高。
速報
Google在I/O宣布人工智慧生成答案成為搜尋主景,傳統以十條藍色連結為核心的SEO規則因此改變。AI會整合來源並以摘要呈現,品牌對於被如何描述的可見性下降。Scrunch表示,行銷與創辦人應調整策略,強化可引用的原始內容與來源透明度,以維持流量與認知。