全雙工會話 - Agents Report

深度分析

多層感知與 Graph-of-Thoughts (GoT)：可解釋的全雙工會話行為推理框架

語音對話系統需要在同時聽與說時做出即時判斷，處理語音重疊與微停頓。本研究提出以多層感知模組先辨識高階語行為，再在低階互動動作上做因果式預測與標註。系統以每秒為單位輸出兩層語行為與可讀取的推理理由，並以動態思維圖譜(Graph-of-Thoughts)串連決策過程。實驗在模擬與真實雙向對話上驗證，顯示在層級行為辨識與可解釋推理上具穩定表現與遷移能力。

多層感知與 Graph-of-Thoughts (GoT)：可解釋的全雙工會話行為推理框架

Human‑1：以 Moshi（Mimi + RQ‑Transformer）適配印地語的全雙工語音會話實作與驗證