8月4日,小米發(fā)布和全量開源了MiDashengLM-7B模型。MiDashengLM-7B聲音理解性能在22個(gè)公開評(píng)測(cè)集上刷新多模態(tài)大模型最好成績(jī)(SOTA),單樣本推理的首Token延遲(TTFT)僅為業(yè)界先進(jìn)模型的1/4,同等顯存下的數(shù)據(jù)吞吐效率是業(yè)界先進(jìn)模型的20倍以上。在當(dāng)前版本的基礎(chǔ)上,小米已著手對(duì)該模型做計(jì)算效率的進(jìn)一步升級(jí),尋求終端設(shè)備上可離線部署,并完善基于用戶自然語言提示的聲音編輯等更全面的功能。(36氪)