速報
Template Constrained Decoding (TeCoD):提升 Text-to-SQL 準確度與效能的新框架
大型語言模型在 Text‑to‑SQL 上雖已顯著進步,但面對未見過的資料庫結構仍易產生錯誤。研究者推出 TeCoD,將歷史 NL‑SQL 配對轉為可重用模板,並以微調的自然語言推理模型快速匹配查詢,接著以文法限制的分割解碼確保 SQL 合法。實驗顯示,TeCoD 在正確率上較傳統方法提升最高 36%,執行延遲降低至 2.2 倍。
速報
大型語言模型在 Text‑to‑SQL 上雖已顯著進步,但面對未見過的資料庫結構仍易產生錯誤。研究者推出 TeCoD,將歷史 NL‑SQL 配對轉為可重用模板,並以微調的自然語言推理模型快速匹配查詢,接著以文法限制的分割解碼確保 SQL 合法。實驗顯示,TeCoD 在正確率上較傳統方法提升最高 36%,執行延遲降低至 2.2 倍。
速報
大型語言模型閱讀助理正從檢索轉向解讀,帶來解釋性勞務外移的風險。本研究以 TextWalk 為共同閱讀原型,採十步提問測試十二篇論說文,從基礎支援到邊界壓力觀察系統行為。結果顯示系統在解釋性詢問時負荷升高,雖能在壓力下部分恢復,但仍在支援與取代之間過度分配解釋任務。
速報
研究結合語言模型與符號抽象,讓機械連桿的拓撲選擇與參數調整同步優化。模型在離散拓撲探索與連續參數優化之間切換,透過提升運算子將模擬軌跡轉為動作標籤與結構診斷,支援多輪迭代設計。
速報
本研究提出一套由五個代理人組成的統一架構,能自動從資料集與自然語言目標產出端對端機器學習管線。系統結合代碼為基礎的檢索增強生成(RAG)以理解微服務,並使用可解釋的混合推薦演算法選擇最佳組件。透過大型語言模型進行錯誤詮釋與自我修復,並從執行歷史中自適應學習。
速報
科學研究長期由人類主導,AI 代理開始涉足自主探索。Qiushi 發現引擎結合 LLM、Meta-Trace 記憶與雙層架構,在實體光學平台自動重現傳輸矩陣實驗,並將相干序理論轉為可觀測指標。最終提出並驗證光學雙線性交互,提供高效光學硬體的計算新途徑。
速報
OpenAI 近日宣布,將新資安工具 Cyber 僅限關鍵資安防守者使用,需提交憑證與使用計畫。Cyber 支援滲透測試、漏洞偵測與惡意程式逆向等功能,旨在協助企業找出安全缺口。此政策與 Anthropic 限制 Mythos 的做法相呼應,顯示業界對 AI 資安工具濫用的擔憂持續升溫。
速報
OpenAI 於本週四宣布,為 ChatGPT 與 Codex 使用者提供名為「進階帳號安全」的可選防護機制。啟用後,帳號將不再接受傳統密碼登入,必須使用實體安全金鑰或 Passkey,並移除 Email、簡訊的復原方式,改以復原金鑰或備份 Passkey。
速報
角色扮演的 LLM 需要模擬內在思考,研究推出 HER 框架以雙層思考區分人物第一人稱與模型第三人稱,並透過逆向工程收集推理資料與人類對齊獎勵模型。實驗顯示在 CoSER 基準提升 30.26 分,於 Minimax Role‑Play Bench 增益 14.97%。
速報
背景:某些生成任務需從同一文件解出多個獨立序列。核心:HPD透過批次共享記憶體與計算並操控位置ID,實現亂序與並行生成,且可在單一提示堆疊多份文件以放大並行度。主要結果:在不降低品質下,推理成本與時間最多減少13.8倍,並可在單提示並行解碼至多96個token。
速報
研究針對對齊語言模型提出輸入詞嵌入控制法:以黑盒文字審查API做零階梯度估計,對輸入嵌入執行梯度下降以減低生成回應的語意有害性。實驗在標準安全基準上將所有被標記回應中和,顯示輸入嵌入能作為有效控制變數。方法在語意層面進行微粒度優化,非僅表面詞彙過濾,對實務安全防護有潛在應用價值。
速報
結構泛化挑戰語意解析系統將已學規則套用到新結構。本文提出一種不依賴手寫組合規則、以帶離散瓶頸的神經細胞自動機(NCA)為核心的方法:透過局部迭代在資料中自學所有組合規則,並以類似細胞自動機的局部運算逐步建構全局語意結構。
速報
多代理強化學習依靠通訊機制協調行為並改善協作效率與收斂表現。許多方法以互動圖表述關係,並用圖神經網路學習消息傳遞,讓代理互補表徵與決策。本文綜述近期研究並提出一套泛化的GNN通訊流程,旨在統一概念並便於比較不同做法。該流程抽象化通訊步驟,有助於辨識設計選擇與方法限制。