5月20日,騰訊正式發(fā)布混元游戲視覺生成平臺,這是依托混元大模型打造的首個(gè)工業(yè)級AIGC游戲內(nèi)容生產(chǎn)引擎,大幅優(yōu)化游戲資產(chǎn)生成與游戲制作流程。其面向游戲工業(yè)級內(nèi)容生產(chǎn),為游戲美術(shù)設(shè)計(jì)師提供一系列AI工具,幫助游戲設(shè)計(jì)廠商快速生成符合創(chuàng)作意圖的高質(zhì)量游戲素材/概念草案,讓游戲美術(shù)設(shè)計(jì)效率提升數(shù)十倍。目前,該“混元游戲”通過騰訊混元官網(wǎng)提供體驗(yàn)入口,面向游戲行業(yè)設(shè)計(jì)師開放申請。
5月16日,騰訊發(fā)布最新混元圖像2.0模型(Hunyuan Image2.0)。騰訊混元表示,相比前代模型,騰訊混元圖像2.0模型參數(shù)量提升了一個(gè)數(shù)量級,可實(shí)現(xiàn)毫秒級響應(yīng),支持用戶可以一邊打字或者一邊說話一邊出圖。新模型圖像生成質(zhì)量提升明顯,可有效避免AIGC圖像中的“AI味”模型于即日起在騰訊混元官方網(wǎng)站上線,并對外開放注冊體驗(yàn)。
專注于高級大語言模型開發(fā)的WizardLM項(xiàng)目創(chuàng)建者徐燦日前發(fā)文表示,他和團(tuán)隊(duì)離開微軟,加入了騰訊的AI開發(fā)組織——混元(Hunyuan),“我們將繼續(xù)我們的使命,推動LLM培訓(xùn)技術(shù)的發(fā)展,并構(gòu)建更好的AI模型?!睋?jù)知情人士透露,WizardLM團(tuán)隊(duì)有6名主力成員,大部分已經(jīng)離開微軟。
5月9日,騰訊混元團(tuán)隊(duì)發(fā)布并開源全新的多模態(tài)定制化視頻生成工具HunyuanCustom。該模型基于混元視頻生成大模型(HunyuanVideo)打造,在主體一致性效果超過現(xiàn)有的開源方案,并可媲美頂尖閉源模型。HunyuanCustom融合了文本、圖像、音頻、視頻等多模態(tài)輸入生視頻的能力,是一款具備高度控制力和生成質(zhì)量的智能視頻創(chuàng)作工具。
4月23日,騰訊混元3D生成模型正式發(fā)布2.5版本新模型,建模精細(xì)度上大幅提升,實(shí)現(xiàn)超高清的幾何細(xì)節(jié)建模,表面更平整、邊緣更銳利、細(xì)節(jié)更豐富。在模型架構(gòu)上,混元3D v2.5也實(shí)現(xiàn)了全面升級,總參數(shù)量從1B提升至10B,有效面片數(shù)增加超10倍。混元3D AI創(chuàng)作引擎全面更新至v2.5模型底座,同時(shí)免費(fèi)生成額度翻倍,提升至每天20次。混元3D生成API也已正式上線騰訊云,面向企業(yè)和開發(fā)者開放。
3月21日,騰訊混元宣布,正式推出自研深度思考模型混元T1正式版。在體現(xiàn)推理模型基礎(chǔ)能力的常見benchmark上,如大語言模型評估增強(qiáng)數(shù)據(jù)集MMLU-PRO中,混元T1取得87.2分,僅次于o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數(shù)學(xué)、邏輯推理的公開基準(zhǔn)測試中,混元T1的成績也達(dá)到業(yè)界領(lǐng)先推理模型的水平。
3月18日,騰訊混元宣布推出5個(gè)全新3D生成模型,在生成速度、細(xì)節(jié)和材質(zhì)表達(dá)上均有提升,并且全部開源。 同時(shí),其自研的3D AI創(chuàng)作引擎也迎來升級,新增多視圖輸入、模型智能減面、格式全兼容等能力,面向C端用戶全面開放使用。最新開源模型包括多視角形狀模型Hunyuan3D-2mv和0.6B形狀模型Hunyuan3D-2mini等。
2月27日,騰訊混元自研的快思考模型Turbo S正式發(fā)布。據(jù)了解,混元Turbo S能夠?qū)崿F(xiàn)“秒回”,吐字速度提升一倍,首字時(shí)延降低44%,同時(shí)在知識、數(shù)理、創(chuàng)作等方面也有突出表現(xiàn)。通過模型架構(gòu)創(chuàng)新,Turbo S 部署成本也大幅下降,持續(xù)推動大模型應(yīng)用門檻降低。該模型已在騰訊元寶上線,用戶可以選擇Deepseek R1 或騰訊混元T1模型進(jìn)行回答。騰訊混元表示,正式版的騰訊混元T1模型API也將很快上線,對外提供接入服務(wù)。
2月17日,騰訊AI助手“騰訊元寶”迎來重大更新,除DeepSeek-R1滿血版外,騰訊自研的混元T1深度思考模型也在騰訊元寶開啟小范圍灰測,用戶可以自行選用。目前,騰訊元寶內(nèi)的各個(gè)模型均支持聯(lián)網(wǎng)搜索,覆蓋公眾號等騰訊生態(tài)內(nèi)容及互聯(lián)網(wǎng)權(quán)威信源,這也是元寶在眾多AI應(yīng)用中的差異化優(yōu)勢。
1月21日,騰訊混元3D AI創(chuàng)作引擎正式上線。該引擎可通過一句話、提示詞或圖片,直接生成高質(zhì)量3D模型。此外,還有3D功能矩陣、3D編輯、3D生成工作流、創(chuàng)作素材庫等多種功能。與其他同類型模型相比,騰訊混元3D AI是首個(gè)同時(shí)支持文字、圖像生成3D的開源大模型,解決了現(xiàn)有3D生成模型在生成速度、泛化能力、生成質(zhì)量上的不足。除了基礎(chǔ)的模型生成,該創(chuàng)作引擎還支持生成3D動畫、草圖生3D、3D人物生成、3D小游戲創(chuàng)作等功能。
12月3日消息,騰訊混元大模型今日宣布混元視頻生成大模型HunYuan Video正式上線,并開源。該模型參數(shù)量130億,具備原生轉(zhuǎn)場和切鏡能力,一次生成視頻時(shí)長為5s。從視頻生成效果看,HunYuan Video生成視頻遠(yuǎn)景幅度大、動作流暢,在人文場景/人造場所、人、多主體組合這些類目上有較明顯優(yōu)勢,其次在物品和動物/微生物類目也有一定優(yōu)勢。據(jù)混元大模型相關(guān)負(fù)責(zé)人介紹,HunYuan Video此次上線的版本以文生視頻為主,生成視頻分辨率當(dāng)前為720P,此后不排除加更1080P/4k/8k分辨率版本,也不排除增加圖生視頻、視頻自動配樂等功能。目前該模型已上線騰訊元寶APP,用戶可在AI應(yīng)用中的“AI視頻”板塊申請?jiān)囉谩?
11月19日消息,騰訊杰出科學(xué)家劉威,曾任騰訊混元大模型技術(shù)負(fù)責(zé)人,近期已從騰訊離職。劉威今年5月曾以混元大模型技術(shù)負(fù)責(zé)人身份,出席InfoQ主辦的AICon全球人工智能開發(fā)與應(yīng)用大會,并發(fā)表《騰訊混元大模型技術(shù)和應(yīng)用實(shí)踐》的主題演講。他在演講中介紹了混元大模型的技術(shù)進(jìn)展和實(shí)際應(yīng)用,詳細(xì)闡述了該技術(shù)在生成領(lǐng)域的獨(dú)特價(jià)值。對于劉威的離職原因以及未來去向,目前尚無更多信息披露。而騰訊方面暫未對此事作出回應(yīng)。
11月5日,騰訊混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“Hunyuan3D-1.0”正式開源,支持企業(yè)及開發(fā)者精調(diào)、部署等不同場景的使用需求,可在HuggingFace、Github等技術(shù)社區(qū)直接下載,免費(fèi)可商用。本次開源是騰訊混元繼文生圖模型后持續(xù)開放的一大舉措。
9月5日,在2024騰訊全球數(shù)字生態(tài)大會上,騰訊正式發(fā)布新一代大模型——騰訊混元Turbo。該模型采用MoE架構(gòu),比上一代產(chǎn)品推理效率提升100%,推理成本降低50%。對外,騰訊混元Turbo的價(jià)格也比混元Pro降低50%,輸出價(jià)格為0.05元/千tokens,輸入價(jià)格為0.015元/千tokens。
5月17日消息,騰訊集團(tuán)副總裁蔣杰在騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會上表示,騰訊混元大模型目前整體性能已居國內(nèi)第一梯隊(duì),部分中文能力已追平GPT-4。在生視頻能力上,騰訊混元可16s 完成視頻生成。在生3D層面,騰訊混元已布局文/圖生3D,單圖僅需30秒即可生成3D模型。
5月17日上午,在騰訊生成式AI產(chǎn)業(yè)應(yīng)用峰會上,騰訊副總裁、騰訊混元大模型負(fù)責(zé)人蔣杰透露稱,將在今年三季度開源混元最核心的文生文模型。 蔣杰稱,騰訊內(nèi)部正在訓(xùn)練三種尺寸(S、M、L)的文生文模型供開源使用,S版主要部署在手機(jī)端,擁有3B參數(shù)量;M版主要部署在PC端,參數(shù)量為5B;L版主要部署在云/數(shù)據(jù)中心,是30B參數(shù)量的MOE架構(gòu)模型。
據(jù)騰訊混元模型應(yīng)用負(fù)責(zé)人張鋒介紹,騰訊內(nèi)部已經(jīng)有超過400個(gè)業(yè)務(wù)和場景接入混元大模型進(jìn)行測試,部分已經(jīng)發(fā)布。應(yīng)用大模型能力包括知識庫問答、創(chuàng)作、理解、代碼、functioncall、對話等。
4月2日消息,騰訊云副總裁、騰訊混元大模型負(fù)責(zé)人劉煜宏表示,多模態(tài)大模型將重構(gòu)內(nèi)容產(chǎn)業(yè),基于多模態(tài)的應(yīng)用也會百花齊放。他介紹,騰訊混元大模型技術(shù)架構(gòu)已升級為混合專家模型(MoE)架構(gòu),參數(shù)規(guī)模達(dá)萬億,擅長處理復(fù)雜場景和多任務(wù)場景。目前正積極發(fā)展多模態(tài)模型,進(jìn)一步加強(qiáng)文生圖、文生3D以及文/圖生視頻能力。同時(shí)探索基于大模型全面升級的數(shù)智人、語音對話虛擬人、具身智能機(jī)器人等應(yīng)用,提升效率和體驗(yàn)。
10月26日,騰訊宣布,騰訊混元大模型迎來全新升級,并正式對外開放“文生圖”功能。據(jù)介紹,目前已有超過180個(gè)內(nèi)部業(yè)務(wù)接入騰訊混元大模型,包括騰訊會議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。今年9月首批通過備案后,騰訊混元大模型也已經(jīng)面向C端用戶陸續(xù)開放體驗(yàn)。
10月19日,騰訊的人工智能大模型產(chǎn)品混元助手已經(jīng)進(jìn)入對外測試階段,用戶在獲得相應(yīng)的測試資格后方可正常使用。騰訊混元助手是由騰訊研發(fā)的大語言模型的平臺產(chǎn)品,具備跨領(lǐng)域知識和自然語言理解能力,實(shí)現(xiàn)基于人機(jī)自然語言對話的方式,理解用戶指令并執(zhí)行任務(wù),幫助用戶實(shí)現(xiàn)人獲取信息,知識和靈感。