深度分析
使用 Sentence Transformers 與 MatryoshkaLoss 微調 Qwen3‑VL 用於多模態文件檢索
背景:Sentence Transformers 擴展至多模態以處理文字與影像檢索。做法:以 Qwen3‑VL‑Embedding‑2B 在 Visual Document Retrieval 資料上微調,採 CachedMultipleNegativesRankingLoss 與 MatryoshkaLoss 訓練,並以 InformationRetrievalEvaluator 評估。結果:微調使 NDCG@10 從 0.888 提升到 0.947。