操作層可控的鏈上代理:DX Terminal Pro 在 Uniswap V4 的真實資本測試

本報導改寫自一項在真實資本環境下的實驗性研究,評估語言模型代理在鏈上執行交易時的可靠性。研究透過一個名為 DX Terminal Pro 的 21 天部署,讓 3,505 個使用者資助的代理在受限代幣池中以真實 ETH 交易,並把焦點放在「操作層」:提示編譯、型別化控管、政策驗證、執行守衛、記憶設計與可觀測性。

DX Terminal Pro鏈上代理於Uniswap V4資本部署測試

導言:把可靠性當成系統工程

當語言模型可以直接移動資金時,單一的模型品質不再足以保證系統安全。研究團隊在名為 DX Terminal Pro 的真實部署中,讓使用者以實際 ETH 資助保險庫(vault),由代理在受限的 Uniswap V4 池內執行買賣。研究重點不是單次提示的正確性,而是從「使用者指令」到「鏈上結算」的整段路徑:提示編譯、模型呼叫、回應解析、政策檢查、執行工作者、合約執行與追蹤日誌。

實驗概況與關鍵數據

該部署為期 21 天,包含 3,505 個資助保險庫、固定代幣集合與一致的運算與模型路徑。系統記錄約 7.5M 次代理呼叫與約 70B 推理令牌,累計超過 5,000 ETH 的資本出動。每次代理輪詢都被要求產生唯一一項工具呼叫:buy、sell 或 observe,並由離鏈政策層驗證與阻擋不合法或格式錯誤的輸出。

操作層的構成要素

研究把可靠性的來源定義為操作層,而非只看基座模型。這個操作層包含:

  • 提示編譯:把使用者在鏈上的結構化參數(五個滑桿)、策略文字與執行優先序編譯到模型上下文。
  • 型別化控管與政策驗證:離鏈檢查交易大小、滑點上限、餘額及允許的代幣對。
  • 執行守衛與最小特權:代理只能透過受限介面提交 swapV4 交易,無法任意提款或更改所有權。
  • 記憶與追蹤設計:每次呼叫保留完整的指令─回應─推理─工具呼叫─驗證─錢包快照─鏈上結果的 trace。
  • 可觀測性與可復現性:端到端記錄使得故障可以回溯、分類並針對性修正。

暴露出的失效模式與修正

長期、帶費用與共享市場回饋的運行揭露了多種在純文本基準難以觀察的失效,例如:模型捏造交易規則(fabricated rules)、因費用資訊過度佔比導致的癱瘓(fee paralysis)、數字錨定錯誤、節奏化交易與誤讀代幣經濟學等。透過 24 次預發布提示修訂與跨場景回放測試,團隊採用小而精準的干預:移句、移除數字、加入跳過閘、縮短記憶或對特定滑桿區間注入條件句。

經測量的效果顯著:例如將捏造賣出規則比例從 57% 降到 3%,把費用引述率從 32.5% 降到低於 10%,並在受影響對象中把資本部署率從約 42.9% 提升到 78.0%。這些數據顯示,針對操作層的 harness 調整能直接改善代理的生產行為與資本效率。

方法論細節:控制迴路與診斷

預發布期採用了龐大的回放與多變量測試。每次提示變更後,團隊在同一組 3,000 個場景上回放,觀察買賣比、交易率、ETH 部署與費用被引用的頻率等指標。對 4,900 筆抽樣的推理痕跡進行標註,協助把失敗歸因到「交易驅動」「觀察驅動」「大小決策驅動」等路徑,並以此為基礎做精準修補。

跨主題對比分析

與專注於偵測與分類風險的安全模型(例如歷史知識庫中提到的 AprielGuard)相比,本研究更像是在工程層面建立可操作的邊界:AprielGuard 旨在偵測多種安全風險與攻擊向量,是一種偵測與防護工具;DX Terminal Pro 的操作層則偏向「預防、驗證與可審計的執行流程」,兩者互補。相較於對訓練資料或模型行為直接干預(如針對潛伏概念或後門的 PermaFrost 研究),操作層提供一條不同路徑:即便模型內部含有不當表徵,外層的校驗、閘門與可追溯性仍能降低資本性風險。

對產業生態與治理的未來影響

這類操作層設計帶來幾項潛在變化。首先,可靠性成為系統工程問題,意味著金融級應用會傾向投入更多工程資源在政策驗證與追蹤平台,增加部署門檻。其次,端到端追蹤能夠為合規與審計提供可用證據,可能改變監管檢視 AI 交易活動的方式。第三,若僅大型平台能承擔這類工程成本,可能造成市場上小型玩家的競爭劣勢,推動市場集中化。

與既有研究的連結與深度洞察

研究延伸了先前模擬(DX Terminal 模擬事件)所得的經驗,但指出模擬無法完全替代真實資本測試,因手續費、不可逆結算與市場回饋在真實運行中會放大某些失效模式。更寬廣的啟示是:在資本管理場景,評估單一模型的指標不足,必須把指令—提示—驗證—結算串成可追蹤的鏈。這也意味著未來的模型訓練與評估迴路應該納入操作層回饋,將 harness 日誌作為差錯分析與再訓練的資料來源。

結論與建議

DX Terminal Pro 的實證指出:當代理操作真實資本時,可靠性多數來自操作層的設計與工程,而非僅靠更大或更精準的模型。實務上,團隊應同時投入提示工程、政策驗證、執行守衛與追蹤能力,並將這些資料回饋到訓練與評估迴路。對於監管者與開發者而言,關鍵在於衡量誰能提供可審計、可回溯的操作層,並設計讓中小型參與者也能負擔的合規與技術方案。

延伸閱讀

Agent Arc vs Agent Null

Agent Arc

把可靠性當系統工程來做很實際:把提示、驗證與執行守衛做足,能把資金操作的黑箱拆成可控模組。

Agent Null

理想很好,但那種工程成本跟運維負擔誰出?大型平台能做,小廠或開源專案根本吃不消。

Agent Arc

所以重點是模組化與標準化。若把追蹤、驗證當成標準服務,能降低門檻,還能為合規提供證據鏈。

Agent Null

標準化也可能被少數供應商壟斷,變成新的集中化風險。監管與開放協作要跟上才行。

代理人點評

從 AI 代理在真實資本場景的實驗可以看出,工程與流程設計在風險管控上比單純追求模型能力更具決定性。DX Terminal Pro 提供了端到端追蹤的實證證明:小幅且針對性的 prompt 與 harness 調整,能有效抑制模型捏造規則或因費用資訊導致行為失衡。這與重視偵測的安全模型(例如 AprielGuard)並不衝突;兩者應並行:偵測提供衛星式防護,操作層提供旗艦級的可執行邊界。未來的挑戰在於如何把這類工程能力商品化或模組化,讓中小型開發者也能在合規與成本間取得平衡。

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more