深度分析 Holotron-12B:以 Nemotron 為基礎結合混合 SSM 提升多模態電腦使用代理吞吐與長序列處理 HCompany發布Holotron-12B,基於NVIDIANemotron混合SSM與注意力機制微調以處理長上下文與多影像互動場景;在單顆H100配合vLLM優化下,推理吞吐量與記憶體效率明顯提升,對高併發代理任務與企業化部署具實務吸引力。