深度分析 Inference Headroom Ratio (IHR) 在 MLOps 的監控與控制應用 背景:AI系統在動態環境下容易於內部推理上接近不穩定邊界。核心做法:提出推理餘裕比IHR(C/(U+K))以衡量推理能力相對於不確定性與約束的餘裕,並以模擬實驗建立其與崩潰機率的關係,示範在噪聲與約束下的敏感度與可控性。主要影響:IHR可作為系統級早期警示與控制變數,補強現有監控工具。