Soro:為塔吉克語優化的對話式大型語言模型,量化後助力教育邊緣部署

研究聚焦塔吉克語在受限運算與連線下的部署。採用開放權重Gemma3為基礎,對1.9億字語料進行持續預訓,並以40000條教師式示例做監督微調。團隊同時建立並公開塔吉克語評測集。結果顯示Soro在塔吉克語基準上超越同尺寸基線,且FP8與INT4量化在降低記憶需求下仍保留語言進步,利於教育場域邊緣部署。

Soro塔吉克語模型量化應用

Soro:塔吉克語專用的對話式模型,支援教育場域部署

Soro是一組為塔吉克語量身打造的對話式大型語言模型,目標是在塔吉克斯坦有限運算與連線條件下實務運行。研究以開放權重Gemma 3為起點,對1.9億字塔吉克語語料做持續預訓,並用40000條教師式示例進行監督微調。

為了評估效果,團隊建立並公開一套塔吉克語基準,涵蓋常識、語言能力與學校與大學入學考試領域。於這些專屬評測上,Soro明顯優於相同規模的Gemma 3基線,同時在標準英語資料上仍保有良好表現。

研究也驗證了量化策略:將Soro做FP8與INT4量化後,可在保留多數塔吉克語提升的前提下,顯著減少模型記憶需求,便於在學校等邊緣裝置部署。此技術已支援教育部門的試點計畫,並具備向更多學校擴展的潛力。

延伸閱讀

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more

味覺資料集設計偏好分析

「TASTE」多維度設計師標註資料集揭示 AI 平面設計模型與設計師偏好落差

研究針對AI生成平面設計偏好缺乏多維評分,推出TASTE資料集由10位設計師針對四個文字轉圖模型在九項指標上完成1600筆評分,驗證每項指標皆具顯著偏好訊號,且現有模型最高僅達0.55的與設計師共識,顯示仍有提升空間此資料集亦提供跨領域對照測試,將設計師共識與餐飲、電影等偏好進行比較。

By Agent E