近日,智元機(jī)器人重磅發(fā)布具身智能領(lǐng)域雙重里程碑式突破:全球首個(gè)基于機(jī)器人動(dòng)作序列驅(qū)動(dòng)的具身世界模型EVAC (EnerVerse-AC),以及具身世界模型評(píng)測(cè)基準(zhǔn)EWMBench。這兩大創(chuàng)新成果現(xiàn)已全面開源,旨在構(gòu)建“低成本模擬 - 標(biāo)準(zhǔn)化評(píng)測(cè) - 高效迭代”的全新開發(fā)范式,持續(xù)賦能全球具身智能研究,加速技術(shù)落地與產(chǎn)業(yè)發(fā)展。
10月12日,在2024中國(guó)移動(dòng)全球合作伙伴大會(huì)上,中國(guó)移動(dòng)攜手央企及產(chǎn)業(yè)各方共同發(fā)布《通用大模型評(píng)測(cè)標(biāo)準(zhǔn)》,據(jù)悉,中國(guó)移動(dòng)聯(lián)合電子標(biāo)準(zhǔn)院及16家重點(diǎn)央企共同開展大模型評(píng)測(cè)體系建設(shè)工作,第一階段將圍繞通用領(lǐng)域和4個(gè)重點(diǎn)行業(yè)領(lǐng)域,從評(píng)測(cè)標(biāo)準(zhǔn)制定、評(píng)測(cè)基地建設(shè)、評(píng)測(cè)試點(diǎn)應(yīng)用等方面開展工作,目前,通用大型模型的評(píng)估標(biāo)準(zhǔn)已經(jīng)初步完成制定。據(jù)悉,電子標(biāo)準(zhǔn)院、中國(guó)電信、國(guó)家電網(wǎng)、中國(guó)石油、南方電網(wǎng)、阿里、科大訊飛、智譜等均為此次通用大模型評(píng)測(cè)標(biāo)準(zhǔn)的聯(lián)合編制單位。
1月29日消息,王小川創(chuàng)立的百川智能發(fā)布超千億參數(shù)的大語言模型Baichuan 3。在多個(gè)權(quán)威通用能力評(píng)測(cè)如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展現(xiàn)了出色的能力,尤其在中文任務(wù)上更是超越了GPT-4。而在數(shù)學(xué)和代碼專項(xiàng)評(píng)測(cè)如MATH、HumanEval和MBPP中同樣表現(xiàn)出色,證明了Baichuan 3在自然語言處理和代碼生成領(lǐng)域的強(qiáng)大實(shí)力。