LatentChem:突破化學推理的連續潛在向量介面
目前化學大型語言模型大多依賴明確的思考鏈(Chain‑of‑Thought, CoT)來解決複雜推理問題,但將化學邏輯硬塞入文字會產生「模態不匹配」的瓶頸。研究團隊推出 LatentChem,透過連續思考向量與動態感知,將化學推理與語言生成解耦,讓模型在內部以潛在計算取代冗長文字。
目前化學大型語言模型(LLM)主要依賴明確的思考鏈(Chain‑of‑Thought, CoT)來處理複雜的推理任務。然而,將非語言的化學邏輯強行轉換成離散的自然語言,會產生「模態不匹配」的瓶頸,限制推理效能。
LatentChem:解耦化學邏輯與語言生成
研究團隊提出 LatentChem 作為推理介面,將化學邏輯從文字生成中抽離,改以連續的思考向量(thought vectors)與動態感知(dynamic perception)進行資訊處理。模型在執行任務時,會自動選擇以潛在計算取代冗長的文字推導,這種「自發內化」行為是在僅以結果為優化目標下產生的。
實驗結果與效能提升
在嚴格的 ChemCoTBench 基準測試中,LatentChem 的非平局勝率達 59.88%,顯著優於傳統 CoT 基線。同時,推理步驟平均減少 10.84 倍,牆時速度提升約 5.96 倍,證明連續潛在動態是更自然且高效的化學推理方式。
這些發現提供了實證證據,說明化學推理在連續潛在空間中比離散文字軌跡更具優勢,未來或可應用於更廣泛的化學資訊平台與自動化實驗設計。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。