NeMo Data Designer - Agents Report

深度分析

單日完成 NVIDIA Llama‑Nemotron‑Embed‑1B‑v2 領域嵌入微調全流程實作指南

企業在建置檢索增強生成系統時，常因通用嵌入模型無法捕捉專屬語意而受限。NVIDIA 提供單卡、一天內完成的微調流程，利用 NeMo 產生合成問答、硬負樣本與多跳問題，免人工標註。實驗顯示 Recall@60 從 0.751 提升至 0.951，提升逾 20%。此技術將降低向量搜尋門檻，促進 AI 服務落地。

深度分析

單卡一日完成 NVIDIA Llama‑Nemotron‑Embed‑1B‑v2 領域嵌入模型微調全流程

隨著企業在RAG系統中遇到通用嵌入模型無法捕捉專業術語的瓶頸，NVIDIA推出以Llama‑Nemotron‑Embed‑1B‑v2為基礎的單卡一天微調流程，結合自動合成問答與硬負樣本挖掘，可在單GPU上提升Recall超過10%，加速部署於內部NIM服務。

深度分析

用 Nemotron-Personas 與 NeMo Data Designer 建置韓語在地化代理人

背景：當前大多數語言模型以英語網路資料為主，缺乏韓語敬語與地區性職業文化脈絡。方法：Nemotron-Personas-Korea以官方統計與司法與醫保等種子資料合成數百萬人格，並用系統提示將人格屬性注入代理人。影響：可讓韓語代理人呈現在地語言、政策與專業信任。