3月21日,騰訊混元宣布,正式推出自研深度思考模型混元T1正式版。在體現(xiàn)推理模型基礎(chǔ)能力的常見benchmark上,如大語言模型評估增強數(shù)據(jù)集MMLU-PRO中,混元T1取得87.2分,僅次于o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數(shù)學(xué)、邏輯推理的公開基準(zhǔn)測試中,混元T1的成績也達(dá)到業(yè)界領(lǐng)先推理模型的水平。(證券時報)
3月21日,騰訊混元宣布,正式推出自研深度思考模型混元T1正式版。在體現(xiàn)推理模型基礎(chǔ)能力的常見benchmark上,如大語言模型評估增強數(shù)據(jù)集MMLU-PRO中,混元T1取得87.2分,僅次于o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數(shù)學(xué)、邏輯推理的公開基準(zhǔn)測試中,混元T1的成績也達(dá)到業(yè)界領(lǐng)先推理模型的水平。(證券時報)