互動模型
Thinking Machines 推出互動模型:以多模態感知強化人機協作
前 OpenAI 技術長 Mira Murati 所創辦的 Thinking Machines 提出一套以人為中心的 AI 願景:新型「互動模型」能透過鏡頭與麥克風直接理解連續、雜訊與非結構化的人類互動,掌握停頓、打斷與語氣變化,並即時調整回應。與目前以文本提示驅動、追求完全自動化的主流路線不同,這種設計強調人機協作、個人化與可控性。
互動模型
前 OpenAI 技術長 Mira Murati 所創辦的 Thinking Machines 提出一套以人為中心的 AI 願景:新型「互動模型」能透過鏡頭與麥克風直接理解連續、雜訊與非結構化的人類互動,掌握停頓、打斷與語氣變化,並即時調整回應。與目前以文本提示驅動、追求完全自動化的主流路線不同,這種設計強調人機協作、個人化與可控性。
深度分析
Thinking Machines發布互動模型研究預覽,提出把互動性視為模型的原生能力,改變過去「輪替式」的輸入—處理—回應流程。該架構以全雙工、多流微回合設計,將音訊以dMel、影像以小貼塊投入輕量嵌入層,採編碼器免除的早期融合從頭共同訓練,並以互動模型與後台模型雙系統分工,達成同步聆聽與回應、同時維持後台深度推理。