速報 Cosmos 3:全域式多模態世界模型突破 NVIDIA 發布 Cosmos 3 系列全域式多模態世界模型,能同時處理與產生文字、影像、影片、音訊與動作序列,採用混合 Transformer 架構,支援高度彈性的輸入輸出配置。此模型統合了視覺語言、影片生成、世界模擬與行動決策等功能,成為實體 AI 的通用骨幹。