北京時(shí)間5月29日,英偉達(dá)CEO黃仁勛在財(cái)報(bào)電話會(huì)上說(shuō),來(lái)自中國(guó)的DeepSeek和Qwen(阿里通義千問)是開源AI模型之中最好的。免費(fèi)發(fā)布后,它們?cè)诿绹?guó)、歐洲及其他地區(qū)獲得了巨大關(guān)注。最終,贏得AI開發(fā)者的平臺(tái)將贏得AI。出口限制應(yīng)該加強(qiáng)美國(guó)平臺(tái),而不是將世界上一半的AI人才推向競(jìng)爭(zhēng)對(duì)手。
5月30日,阿里云宣布,通義靈碼AI IDE正式上線,即日起用戶可在通義靈碼官網(wǎng)免費(fèi)下載開箱即用。自此,通義靈碼已擁有插件和IDE兩種產(chǎn)品形態(tài)。作為AI原生的開發(fā)環(huán)境工具,通義靈碼AI IDE深度適配了最新的千問3大模型,并全面集成通義靈碼插件能力,具備編程智能體、行間建議預(yù)測(cè)、行間會(huì)話等功能。通義靈碼AI IDE支持最強(qiáng)開源模型千問3,其代碼能力達(dá)到業(yè)界領(lǐng)先水平,同時(shí)支持MCP協(xié)議,具備強(qiáng)大的工具調(diào)用能力。
4月29日,阿里巴巴開源新一代通義千問模型Qwen3(簡(jiǎn)稱千問3),參數(shù)量?jī)H為DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等領(lǐng)先模型,登頂全球最強(qiáng)開源模型。千問3是國(guó)內(nèi)首個(gè)“混合推理模型”,將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,大大節(jié)省算力消耗。據(jù)了解,千問3采用混合專家(MoE)架構(gòu),總參數(shù)量235B,激活僅需22B。千問3預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T tokens,并在后訓(xùn)練階段經(jīng)過(guò)多輪強(qiáng)化學(xué)習(xí),將非思考模式無(wú)縫整合到思考模型中。
4月14日舉行的2025年世界互聯(lián)網(wǎng)大會(huì)亞太峰會(huì)主論壇暨數(shù)智未來(lái)論壇上,群核科技聯(lián)合創(chuàng)始人兼首席技術(shù)官朱皓表示,人工智能正在賦能千行百業(yè),但并不能很好走進(jìn)物理世界。需要借助開源的力量,加速AI走向物理世界。朱皓介紹,近年來(lái),人工智能從技術(shù)和應(yīng)用上都取得了飛躍式的發(fā)展。但今天的人工智能依然屬于二維世界,仍難以理解空間關(guān)系和物理規(guī)律。要想創(chuàng)造更大的價(jià)值,就需要向三維現(xiàn)實(shí)進(jìn)階,用以理解三維世界的空間智能技術(shù),成為了關(guān)鍵突破點(diǎn)。開源模型將成為推動(dòng)全球人工智能發(fā)展最強(qiáng)勁的引擎。
4月15日,智譜發(fā)布新一代開源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型權(quán)重,并遵循MIT License。目前系列所有模型可以通過(guò)“z.ai”訪問體驗(yàn)。據(jù)介紹,推理模型GLM-Z1-Air/AirX-0414模型推理速度可以做到最高200 Tokens/秒(MaaS平臺(tái)bigmodel.cn上實(shí)測(cè))。
魔樂社區(qū)(Modelers)今日上架由階躍星辰自研的Step-Video視頻生成和Step-Audio語(yǔ)音模型兩款開源多模態(tài)大模型,并基于華為昇騰CANN異構(gòu)計(jì)算架構(gòu)和昇騰服務(wù)器,完成了對(duì)模型的適配。除魔樂社區(qū)外,魔搭社區(qū)、模力方舟、HuggingFace、Replicate平臺(tái)也已上架。此外,包括天數(shù)智芯、阿里云、火山引擎、金山云、TCL、LiblibAI、歡瑞世紀(jì)等標(biāo)桿企業(yè)均已接入階躍星辰開源生態(tài)。
當(dāng)?shù)貢r(shí)間2月20日,美國(guó)初創(chuàng)公司Together AI宣布完成3.05億美元的B輪融資,估值為33億美元,該輪融資由硅谷VC General Catalyst和沙特阿美旗下基金Prosperity7領(lǐng)投,投資者還包括Salesforce旗下基金、英偉達(dá)等。Together AI在聲明中稱,該輪融資不僅將在推理應(yīng)用側(cè)幫其提供更多能力,從而幫客戶開發(fā)應(yīng)用;還會(huì)在模型訓(xùn)練側(cè)幫其搭建更多英偉達(dá)先進(jìn)GPU,從而對(duì)外提供更多的模型訓(xùn)練服務(wù)。Together AI稱45萬(wàn)的AI開發(fā)者、公司都是其客戶,其中包括了Salesforce、Zoom、SK電信等企業(yè)。Together AI是一家獨(dú)立的開源模型服務(wù)商,為大模型的最終用戶提供開源模型的精調(diào)定制、推理部署的服務(wù),也提供模型訓(xùn)練的基礎(chǔ)設(shè)施,及GPU裸算力的租賃。
12月16日,無(wú)問芯穹宣布正式開源其首個(gè)端側(cè)全模態(tài)理解開源模型Megrez-3B-Omni,并同步開源了純語(yǔ)言版本模型Megrez-3B-Instruct。據(jù)介紹,Megrez-3B-Omni具備圖片、音頻、文本三種模態(tài)數(shù)據(jù)處理能力,選擇了最適合手機(jī)、平板等端側(cè)設(shè)備的30億參數(shù)尺寸,推理速度最大領(lǐng)先同精度模型300%。
9月19日云棲大會(huì),阿里云CTO周靖人發(fā)布通義千問新一代開源模型Qwen2.5,其中,旗艦?zāi)P蚎wen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。Qwen2.5涵蓋多個(gè)尺寸的大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,每個(gè)尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計(jì)上架100多個(gè)模型,刷新業(yè)界紀(jì)錄。截至2024年9月中旬,通義千問開源模型累計(jì)下載量已突破4000萬(wàn),成為僅次于Llama的世界級(jí)模型群。
16日開幕的2023中國(guó)數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展大會(huì)上,騰訊高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生宣布騰訊云TI平臺(tái)正式上架。湯道生表示,“騰訊云TI平臺(tái)支持行業(yè)最新、最流行的開源模型,如Llama2、Falcon、Dolly等,可直接部署調(diào)用,全程低代碼操作?!?