深度分析
非同步連續批次:CUDA 串流、事件與雙槽記憶體池在 LLM 推論的應用
面對雲端 GPU 成本與推論吞吐的雙重壓力,連續批次(continuous batching)雖能降低 padding 浪費,卻仍受限於預設的同步流程,使 CPU 與 GPU 交替閒置。
深度分析
面對雲端 GPU 成本與推論吞吐的雙重壓力,連續批次(continuous batching)雖能降低 padding 浪費,卻仍受限於預設的同步流程,使 CPU 與 GPU 交替閒置。
深度分析
研究指出新勒索家族Kyber宣稱採用後量子公鑰封裝(ML‑KEM)包裝對稱金鑰。其實檔案以AES‑256對稱加密,部分變種僅聲稱使用ML‑KEM但實際採用RSA。安全廠商Rapid7逆向發現Windows版本使用ML‑KEM1024。此作法更像行銷與心理策略,可能改變受害者談判與保險評估。
深度分析
安全研究團隊公開了一個名為CopyFail的Linux核心漏洞與可跨發行版的利用程式。漏洞源自加密API的邏輯失誤,導致認證副本複製超出緩衝區並覆寫記憶體。單一腳本即可在多數發行版上穩定提權,並可導致容器逃脫與多租戶系統全面破口。需立即修補與檢測並審慎評估影響
深度分析
Mozilla公開以Anthropic Mythos結合自製agent harness分析Firefox原始碼的流程。團隊用改良模型搭配可執行測試與第二個LLM驗證,讓模型產出可觸發記憶安全缺陷的測試案例並自動確認。兩個月內找出271項漏洞,誤報顯著下降。
深度分析
安全研究者以化名 Nightmare-Eclipse 發表名為 YellowKey 的概念驗證,展示如何透過特製的 FsTx 目錄與 Transactional NTFS 行為,在具體物理存取情境下繞過 Windows 11 預設的 BitLocker(TPM-only)保護。
深度分析
AI代理在長時間、多步交互時常忘記先前狀態,擴大上下文或加重RAG成本高且易脆弱。研究團隊提出delta-mem,一個把歷史互動壓縮為固定大小矩陣並在線更新的記憶模組,能在不改動主模型權重下,透過投影與門控δ規則修正模型推理。
深度分析
在微軟收購後,GitHub近年接連出現大規模停擺、內部倉庫遭入侵與重大資安揭露。其核心問題涵蓋服務遷移到Azure、CI/CD與外掛供應鏈的信任缺口,以及AI代碼工具的計費與整合策略變動。這些技術與治理選擇已衝擊系統可用性與供應鏈安全,並引發領導震盪與人才外流。
深度分析
Anthropic在倫敦舉辦CodewithClaude開發者活動,展示ClaudeCode以自我提示與dreaming記錄強化自動化編碼流程。代理能自動測試、修正與互相學習,降低人為介入但也帶來審查與安全挑戰。這種變化快速滲透開發實務,影響生產力與治理。
深度分析
美國新創 Hark 在一輪由 Parkway Venture Capital 領投的 Series A 募得 7 億美元,估值達 60 億美元(事後估值)。公司由 Brett Adcock 發起,團隊目標是打造可與現有產品與服務整合的通用個人助理人工智慧介面,並在推出多模態模型後,推出針對該系統優化的硬體裝置。
深度分析
企業競逐AI代理人平台浪潮中,Kore.ai推出Artemis。平台以YAML為基礎的AgentBlueprintLanguage定義與治理代理人,Arch自自然語言生成可部署ABL並持續優化,採雙腦架構分工LLM推理與可決定性商業規則,強化受管產業的可治理性與跨雲部署。
深度分析
TeamPCP發動長期軟體供應鏈攻擊,持續汙染開源工具並侵入開發生態。攻擊以被下毒的VSCode外掛與開發套件植入惡意程式,竊取憑證後自動發布惡意版本並透過蠕蟲擴散。影響已延燒至多家雲端服務與開發平台,衝擊開源信任與憑證治理。防護對策須從憑證輪換、CI/CD管控到包管理審核多面向強化。
深度分析
聊天機器人進入心理健康場域帶來風險.VERA-MH用臨床設計的三階段流程:由一個LLM扮演使用者模擬多回合對話;再以LLM當裁判配合臨床量表逐題判定;最後彙整評分.實驗對多家主流模型進行安全評估,提供部署前檢測工具.強調臨床驗證與開源透明.可作為業界預檢基準.