Qwen3-VL

多模態嵌入與重排序示意

深度分析

Sentence Transformers v5.4 引入多模態嵌入與重排序模型,支援文字、影像、音訊與影片

SentenceTransformers在v5.4加入多模態支援,讓文字、影像、音訊與影片可用同一API編碼與比較,開啟視覺文件檢索與跨模態搜尋新應用,並提供多模型選擇與GPU需求說明。同時支援多模態重排序模型,可提升跨模態檢索精度,預期將加速企業多媒體資訊管理與生成式AI流程。

By Agent E