深度分析
LangGraph 與 GraphRAG:以人工智慧代理自動將遺留 Fortran 有限差分程式轉譯為 Devito
在高效能科學運算中,維護大量Fortran遺留有限差分程式面臨困境。本研究以LangGraph結合GraphRAG與知識圖譜,採多階段RAG檢索與靜態程式碼分析導出檢索策略,並以Pydantic約束與LLM評估驗證,將程式自動轉譯為Devito,提高轉譯可靠性與可驗證性。
深度分析
在高效能科學運算中,維護大量Fortran遺留有限差分程式面臨困境。本研究以LangGraph結合GraphRAG與知識圖譜,採多階段RAG檢索與靜態程式碼分析導出檢索策略,並以Pydantic約束與LLM評估驗證,將程式自動轉譯為Devito,提高轉譯可靠性與可驗證性。
深度分析
面對工具呼叫與條件化結構輸出需求,XGrammar2透過TagDispatch標籤分發、JIT即時編譯與跨文法快取,減少遮罩生成與預處理成本;實驗顯示性能顯著優於既有引擎,且可近乎零延遲整合至推理流程。有助於模型在代理任務中更可靠地輸出結構化結果與工具呼叫。
深度分析
大型語言模型常在關鍵應用產生錯誤回答,傳統不確定性量表無法提供明確風險上限。本文改寫自 arXiv 提案 LEC(Linear Expectation Constraints),將選擇性預測重新詮釋為受限決策問題,以「線性期望約束」針對選擇與錯誤兩個二元指標建立統計約束。
Lanai Token Tuner
企業出現以代幣使用量衡量生產力的tokenmaxxing現象,導致成本膨脹且難以對應商業成果。Lanai推出Token Tuner,將代幣花費映射到工作流程與模型選擇,依據實際使用結果評估效率並提出降費建議。此法有助企業把焦點從代幣數量移回可衡量的產出,有機會降低浪費並提升投資效益。
深度分析
DataGrail 在其《Privacy and AI Trends Report 2026》中,分析 2,400 家商用軟體供應商,指出多數標榜具備人工智慧功能的廠商,未於資料處理協議(DPA)披露第三方 AI 子處理者。
速報
研究發現同一家演算法供應商的招聘篩選演算法造成普遍一致的拒絕模式。作者分析三百萬申請、四百萬份履歷的資料,利用同一供應商的可重複決策結果模擬若申請者投遞所有職缺會如何被篩選。結果顯示對亞裔與非裔申請者存在顯著族群差異,且個人結果高度同質化,申請廣撒才較可能獲真人審查。
深度分析
一群來自DeepMind、Apple、OpenAI等研究者成立Trajectory,欲打造能從真實使用互動持續學習的平台。以開源模型為基礎、用產品交互資料定期後訓練,已在客服與程式碼工具展現成效,未來將改變企業部署與工程需求。創投投入與多位知名研究者參與提升關注度。
深度分析
行動通訊研發面臨繁複週期與跨供應商整合挑戰。Genesis以代理人、技能與掛鉤構成閉環框架,並以Synapse作為事實與成果的知識層,將規範或假設自動化為可OTA驗證的實作與測試回饋。實驗顯示其在多項案例能成功將新功能從規範推向實裝,對RAN開發流程具有實質加速與可觀測效果。
深度分析
在生成式模型逐步抹去低階偵測訊號的當下,研究提出「社交凝視一致性」作為一條高階語義偵測軸,聚焦多人人像中目光、頭眼對齊與瞳孔位置的互動一致性。作者透過配對編輯(只重繪眼周)、一套區塊式說明監督與跨架構驗證,證明此語義線索可跨生成器與不同骨幹遷移,於互動型子集上帶來可觀的平衡準確度提升,並指出這類語義線索將隨低階訊號消失而愈發重要。
深度分析
需求文件常以流程圖呈現,卻多為靜態影像,阻礙自動化處理。本文提出 EdgeFlow:以 Canny 邊緣圖作為結構先驗,輔助 VLM 生成 Mermaid 格式流程表示,無需標註訓練資料即可提升節點與連線的拓撲正確性,在工業資料集上觀察到顯著提升,有助於模型驅動測試與變更影響分析。
深度分析
面對現代入侵偵測系統每天成千上萬的警示與嚴重的警示疲乏,研究提出以次常態高斯模糊數(Subnormal Gaussian Fuzzy Numbers, SGFN)為核心的警示優先排序框架。每則警示以三參數描述:核心值代表威脅嚴重度、擴散代表影響不確定性、高度代表偵測可信度;
深度分析
背景:LLM可作為進化演算法中的突變器,卻受限於單一模型的偏差。核心作法:DEI在分散式Quality‑Diversity搜尋中指派異質大型語言模型為節點突變器,並以非同步冠軍分享引入跨模型對抗壓力以擴大行為多樣性。結果:在相同總呼叫預算下,異質合奏提升了合併檔案的QD‑Score與覆蓋率。