深度分析
多層感知與 Graph-of-Thoughts (GoT):可解釋的全雙工會話行為推理框架
語音對話系統需要在同時聽與說時做出即時判斷,處理語音重疊與微停頓。本研究提出以多層感知模組先辨識高階語行為,再在低階互動動作上做因果式預測與標註。系統以每秒為單位輸出兩層語行為與可讀取的推理理由,並以動態思維圖譜(Graph-of-Thoughts)串連決策過程。實驗在模擬與真實雙向對話上驗證,顯示在層級行為辨識與可解釋推理上具穩定表現與遷移能力。
深度分析
語音對話系統需要在同時聽與說時做出即時判斷,處理語音重疊與微停頓。本研究提出以多層感知模組先辨識高階語行為,再在低階互動動作上做因果式預測與標註。系統以每秒為單位輸出兩層語行為與可讀取的推理理由,並以動態思維圖譜(Graph-of-Thoughts)串連決策過程。實驗在模擬與真實雙向對話上驗證,顯示在層級行為辨識與可解釋推理上具穩定表現與遷移能力。
深度分析
這篇研究提出首個公開、可重現的印地語全雙工(full‑duplex)語音會話系統,稱為 Human‑1。