深度分析 Sentence Transformers v5.4:引入多模態嵌入與重排序,強化跨模態檢索 Sentence Transformers在v5.4擴展到文字、影像、音訊與影片的多模態嵌入與重排序功能。新版可把不同模態映射到共用向量空間,支援跨模態相似度比較與混合模態重排序,適用於視覺文件檢索與多模態RAG流程。此更新簡化多模態檢索整合,但也提高訓練與部署的資源需求,推升相關微調與基礎設施工具的重要性。