深度分析 Holotron-12B:基於 Nemotron 的混合 SSM-注意力架構,實現伺服端高吞吐多模態代理 H Company 推出 Holotron-12B,一款以 NVIDIA Nemotron 系列為基礎、針對電腦使用代理任務優化的多模態模型。團隊採用混合狀態空間模型(SSM)與注意力機制的 Nemotron 架構,重點在於長序列推理的記憶體效率與高併發伺服能力。