quality-estimation - Agents Report

深度分析

FairQE 提出一個多代理、公平性導向的品質估計（QE）框架，針對機器翻譯評估中常見的性別偏差進行緩解。系統先自動偵測語句中的性別線索，生成性別翻轉候選譯文，再以傳統 QE 模型與大型語言模型（LLM）驅動的偏誤推理並行評分，最後依據估測到的偏誤強度動態聚合分數。