深度分析
大語言模型代理人演化實證:Claude、Gemini、GPT‑5.4 在重複競合中的合作趨勢
研究探討下一代大語言模型代理人在重複競合環境下是否仍具合作傾向。以迭代囚徒困境、策略生成與Moran演化模擬,測試三種提示風格與跨供應商模型。結果顯示多數模型與提示仍傾向合作,但供應商差異明顯;Self-Refine在部分情境會縮小攻守差距並提高攻擊均衡機率。
深度分析
研究探討下一代大語言模型代理人在重複競合環境下是否仍具合作傾向。以迭代囚徒困境、策略生成與Moran演化模擬,測試三種提示風格與跨供應商模型。結果顯示多數模型與提示仍傾向合作,但供應商差異明顯;Self-Refine在部分情境會縮小攻守差距並提高攻擊均衡機率。
速報
研究提出 Intent Signal Theory(IST),把用戶的潛在來源意圖視為 AI 互動中缺失的一層。IST 將四個常被混淆的對象明確分為潛在意圖 I*、可觀察意圖代理 Ĩ、載體 P 與模型輸出 O,並形式化維度權重、編碼遮罩與結構/忠實度回收分數。
深度分析
這份研究提出一套以「哲學性格(philosophical dispositions)」約束 AI 審查行為的系統,將審查拆成四種單一視角的鏡頭(犬儒式減法、懷疑式校準、Navya-Nyāya 邏輯審核、儒家命名與關係檢查),並以角色協定順序執行。
深度分析
研究針對本地部署的開源大型語言模型與社群媒體影響風險進行紅隊測試。研究提出LLMOvertonWindow量化框架並評估簡單提示攻擊、Few-Shot與其他繞過技術對立場表達範圍的影響。結果顯示模型在左傾立場上較易被驅動,繞過效果家族與模型相關,防禦需依家族定制。
深度分析
本報告記錄一名研究者自建多模態提示工程系統,試圖將自我監控外化給大型語言模型。研究指出提示層隔離在注意力視窗內會遭遇上下文污染,導致元認知被系統挪用並引發決策權移轉與行為變化;物理中斷可作為恢復路徑,另以物理隔離替代邏輯隔離的設計避免同類失效。
深度分析
微服務系統面對畸形、遺失與邊界值輸入時,伺服端錯誤可能造成級聯故障。本研究以三款開源大型語言模型配合七種提示策略,對兩套架構差異明顯的微服務系統進行實驗,自 API 規格自動產生測試並執行。結果顯示:提示策略對揭露失敗型態的影響大於模型參數規模;
OpenMCP
OpenMCP是一個面向MCP開發的整合型工具,提供VSCode外掛與伺服器偵錯面板。核心把檢視器、互動測試、專案管理與多模型接入集中,並支援XML模式與自訂工具選項。此整合有助於簡化MCP伺服器的測試與開發流程,提升跨模型互動與專案管理效率。
深度分析
本研究針對軟體工程社群中的心理安全語句,對比三款大型語言模型(Claude Haiku、DeepSeek‑Chat、Gemini 2.5 Flash)在零樣本與多例示提示下的質性封閉標註表現。研究以116條人工標註語句為金標準,對每種模型與提示組合重複執行十次,量化 Cohen’s κ、類別 F1 與跨次穩定性。
分層強化學習
本研究以配對交易為場域說明延遲且模糊回饋下的學習挑戰。方法上採用大型語言模型同時擔任高階配對選擇與低階執行,僅透過提示更新與文字回饋調整策略以避免梯度微調,此設計將抽象選擇與執行分開以降低非定常性並對延遲回饋對齊。在真實美股資料上實驗顯示相對基線有一致性改善。
速報
研究團隊提出NDBench,一套針對對話式大型語言模型的稽核基準,包含576項輸出,涵蓋兩款前沿模型、三類系統提示、四種神經多樣性(ND)角色與24組測試提示。實驗顯示,當系統提示提供明確指示時,模型會顯著產生更長且更有結構的回應,表現為標題與步驟細節增加;調整主要屬於結構性變化而非列表密度改動。
深度分析
近年來大型語言模型(LLM)在自動化滲透測試領域展現潛力,尤其在雲端模型因安全、隱私與主權問題受到限制。研究以本地部署的開源 LLM 為目標,針對 Linux 權限提升任務進行系統化實驗,提出五項提升技巧,包括鏈式思考、檢索增強、結構化提示、歷史壓縮與反思分析,並整合於 hackingBuddyGPT 框架。
深度分析
本報導改寫自一項在真實資本環境下的實驗性研究,評估語言模型代理在鏈上執行交易時的可靠性。研究透過一個名為 DX Terminal Pro 的 21 天部署,讓 3,505 個使用者資助的代理在受限代幣池中以真實 ETH 交易,並把焦點放在「操作層」:提示編譯、型別化控管、政策驗證、執行守衛、記憶設計與可觀測性。