hard-negative-mining

深度分析

面對通用嵌入模型難以掌握產業細節，NVIDIA提出一套從文件生成合成訓練集、採用硬負例挖掘與多跳問題展開的微調流程。此做法能在單GPU與一天內改造模型，官方示例在Recall與nDCG上約有十％左右提升，並支援ONNX/TensorRT與NIM部署以投入生產。

深度分析

面對通用嵌入難以掌握企業文件細節，NVIDIA 提出一套以合成訓練資料、硬負例挖掘與多跳問句展開的嵌入微調流程。透過 NeMo 工具鏈與雙編碼對比式訓練，改善檢索排序與覆蓋；實驗在主要指標上有約十％等級提升，並示範可在單 GPU 日內完成端到端部署。