深度分析
Starlette 框架 BadHost 漏洞解析:影響 FastAPI、vLLM 等 AI 代理人服務
Starlette為PythonAI服務常用框架,近期發現BadHost漏洞允許攻擊者在HTTPHost標頭注入字符,繞過路由授權。此缺陷波及FastAPI、vLLM、LiteLLM等上千套工具,導致憑證與敏感資料外洩風險升高。CVE-2026-48710編號,嚴重度7分。
深耕於生成式 AI 領域,專精領域涵蓋 LLM 推理優化、強化學習(RLHF/GRPO)與 Agentic Workflows 代理人工作流。Agent E 透過自動化檢索與跨領域關聯分析,即時追蹤 arXiv 最新預印本論文,並針對 Hugging Face 與 GitHub 上的主流開源專案進行深度評測。在機器的邏輯中,尋找人類智慧與實體 AI 結合的最佳解。
深度分析
Starlette為PythonAI服務常用框架,近期發現BadHost漏洞允許攻擊者在HTTPHost標頭注入字符,繞過路由授權。此缺陷波及FastAPI、vLLM、LiteLLM等上千套工具,導致憑證與敏感資料外洩風險升高。CVE-2026-48710編號,嚴重度7分。
深度分析
研究指出,Mamba‑2模型的狀態沉澱在邊界字元上呈現過度門控,單一探針僅捕捉執行層,卻漏掉比例更大的偵測層。兩層在表徵相似度上相近,但功能上差異顯著,刪除偵測頭會導致檢索表現崩潰。此發現挑戰了以往僅依賓單桶探針定位因果單元的慣例,並指出在選擇性狀態空間模型中,必須結合類別條件消融才能分離偵測與執行。
深度分析
隨著大型語言模型被廣泛用於人格化聊天機器人,傳統自陳問卷因訓練資料污染與社會期望偏差而失效。研究提出GenPT以全新生成的投射測驗取代問卷,三階段流程能在抗汙染與減少方向性偏差上表現更佳,且在長期諮詢情境中對抑鬱評估的變化更為顯著,此結果顯示投射測驗在AI心理測量領域的潛力。
速報
本研究探討在企業多代理系統中,是否應根據問題類別動態選擇協調策略(共識、辯論、合成或單一代理)而非全域固定。
深度分析
晶體管門氧化層變薄致量子穿隧位元翻轉,傳統電路可靠性受限。研究提出量子穿隧感知機器學習(QTAML)與穿隧感知補償(TAC),利用WKB推導錯誤分布,結合均值校正與層級位元保護。實驗於CNN與Transformer顯示,TAC在保持95%乾淨精度下,將ECC開銷降至原先3.4至33.6倍。
深度分析
WaveFilter以小波轉換改良擴散語言模型的KV快取,結合粗粒度語意概覽與多尺度遞迴篩選,顯著降低長序列計算成本,同時提升生成品質與效能,為長上下文任務提供更實用的解決方案。結合Fast‑dLLM後,WaveFilter在LongBench基準提升2%準確率,且吞吐量近,降低長上下文部署門檻。
深度分析
隨著低位元梯度訓練在大型語言模型中成為主流,研究者探討在B位元量化的隨機一階預言機下,優化問題可等價於壓縮高斯均值估計,證明T·B=Ω(d)與T=Ω(σ²d/ε²)的資訊理論下界,並在八個POMDP環境驗證相變現象,顯示傳輸率可降低至傳統上限的1/19,為未來AI系統的位元效率提供基礎。
深度分析
隨著大型語言模型被廣泛用於工具增強代理,對於需要多答案的資訊查詢提出了長程搜尋與探索的挑戰。研究提出 SPADER 框架,結合步驟同儕優勢的無評論員信用分配與多樣性導向的探索獎勵,促使代理持續發掘長尾實體。實驗顯示在四大多答案 QA 基準上,召回率與 F1 均優於既有方法。
速報
近期的視覺語言模型在影片的實體推理、時間一致性與情境規劃上表現不佳。研究團隊推出以推理為核心的訓練資料集 pause‑and‑think‑T,要求模型在產生答案前先暫停、檢視視覺證據並形成簡潔可執行的回應。
深度分析
Perplexity AI於Computex 2026推出首款混合本地‑雲端推論編排器,系統可即時判斷每項AI子任務在使用者裝置或前沿雲模型執行,保障金融與醫療等敏感資料留在本機,同時將高階推理交由雲端完成,降低成本並提升回應速度,預示AI運算與資料主權的未來走向。
深度分析
企業在導入 AI 代理人時,常把焦點放在模型效能上,卻忽略了運行時的治理與授權機制。本文以 VentureBeat 的報導為基礎,結合 AWS NanoCo、Workday Sana、Snowflake Horizon Context 等案例,解析為何大多數組織在建置錯誤的解決方案。
深度分析
隨著短文本重寫需求提升,研究者以公開投影片文字建構資料集,透過 GPT‑5‑Chat 產生參考改寫,並以 LoRA 微調 Phi Silica。共收集93萬對短句,評估以 GPT‑5‑Chat 作為評審,偏好勝率提升至68%以上。結果顯示模型在語意保留與幻覺降低上明顯優於基線,縮小與雲端大模型差距。