速報
ConceptAgent:在黑盒下喚醒被抹除概念,揭露擴散模型語義控制的侷限
擴散模型廣泛用於文字轉圖,但概念抹除常只壓制未徹底移除。研究從去噪軌跡發現抹除破壞早期文字對齊但語義仍沿動態傳播,因模型後期仰賴噪聲狀態而出現繞過機會。提出ConceptAgent:免訓練黑盒多代理,透過替代導引噪聲起始喚醒被抹除概念,實驗證實在無參數與梯度存取下仍能準確可控喚醒。
速報
擴散模型廣泛用於文字轉圖,但概念抹除常只壓制未徹底移除。研究從去噪軌跡發現抹除破壞早期文字對齊但語義仍沿動態傳播,因模型後期仰賴噪聲狀態而出現繞過機會。提出ConceptAgent:免訓練黑盒多代理,透過替代導引噪聲起始喚醒被抹除概念,實驗證實在無參數與梯度存取下仍能準確可控喚醒。
速報
過去垂直領域(會計、法律、醫療、採購等)軟體常將工作流程、領域規則與責任綁在同一個應用。通用型人工智慧代理人正在把介面與流程拆出,促成「headless」趨勢。文章主張:對部分業者放手介面是正確選擇,對另一些則可能破壞其價值捕捉,關鍵在於區分可移動的介面邊界和不得讓步的責任邊界。
速報
本文把Token經濟學作為觀察大型語言模型(LLM)資源分配與定價的分析框架,強調從理論到實務存在重大缺口。作者提出「計算型Token經濟學」並定義Token Economics三難困境,指出細緻估值、低延遲執行與在不確定下達成配置最適之間存在結構性衝突。
速報
生成式人工智慧快速發展暴露出評估方法的缺陷。QQJ提出以專家設計的多維量表為錨點,並用小量高品質標註校準大型語言模型評估者,使評估與人類判斷對齊。實驗顯示QQJ在一致性與診斷能力上優於既有自動或無約束LLM評估。並在文本與圖像生成任務上展現較高人類對齊度與穩定性,能識別幻覺與意圖不符等關鍵失誤。
速報
心理治療中的認知行為治療多以口語對話進行。研究提出CBT-Audio資料集,收錄1802次病人發話並驗證轉錄與聲音的差異。使用多個開源語音語言模型比較輸入條件,結果顯示加入語音可提升苦惱評估,且在語句內容與語調不一致時效益最明顯。資料可支持未來模型在心理互動應用的評估。
速報
研究背景:大規模語言模型代理人快速演進但缺少整合多種互動範式的統一架構。本文比較Generator‑Evaluator、ReAct與記憶擴充互動,並在開源框架中實作五階段處理流程及六維評估。結果指出預審能揭露需求缺漏,ReAct穩定但增加工具重複呼叫,對抗式討論多用於內容精修。
速報
研究指出現代人工智慧普遍缺乏元認知。研究提出MetaKGEnrich,一套自動化流程:由種子查詢建構知識圖譜、以七種圖譜指標偵測稀疏區域、生成針對性問題並網路檢索佐證回填,最後擷取並評估回覆品質。實驗在三個公開資料集上顯示多數問題的答案品質獲得提升。
速報
在自駕系統逐漸把深度學習模型部署到受限邊緣平台時,掌握在資源退化下的硬體行為變得關鍵。
速報
大型語言模型成為網頁代理與資訊系統核心,將自然語言轉為嚴謹結構格式至關重要。本研究提出Structure-BiEval框架,透過確定性中介表示分離結構與內容,採內容語意準確度與標準化樹編輯距離為量化指標。測試顯示模型在結構化表現上差異明顯且深度遞迴仍具挑戰。
速報
部署中的強化學習缺乏運行時可靠性理論。研究提出雙可預測性P,一個資訊理論指標,量化代理與環境互動轉換不確定性為共同可預測性的效率。實驗顯示P普遍被抑制,且能更早偵測耦合異常。以資訊數位孿生IDT監測,可在低延遲下顯著提高耦合退化偵測率,勝過僅靠獎勵監控。
速報
研究團隊提出VideoGameBench,一套以10款90年代真實遊戲評測視覺語言模型(VLMs)感知、空間導航與記憶管理能力的基準。模型只取得原始畫面與高階目標與控制說明,三款遊戲保密以檢驗一般化。實驗顯示前沿模型在即時互動下多半難以超過開局,推理延遲為主要瓶頸;
速報
大型語言模型常被用作論文第一讀者、但易錯認細項。作者提出Paper.json作為PDF伴隨檔,定義穩定主張ID、明確不宣稱清單、逐圖實驗指令與定義ID,並主張手寫最低合規可在不到一小時內完成。實作含驗證器,示範工具可檢查合規性並促進可重現性。社群儘保留擴充彈性。