3月6日,阿里巴巴發(fā)布并開源全新的推理模型通義千問QwQ-32B,阿里巴巴稱,這是一款擁有320億參數(shù)的模型,其性能可與具備6710億參數(shù)(其中370億被激活)的DeepSeek-R1媲美。
2月25日,阿里Qwen團(tuán)隊在社交媒體宣布發(fā)布新推理模型——深度思考 (QwQ) 。這是在QWQ-MAX-PREVIEW支持下,一個基于Qwen2.5-Max的推理模型。類似DeepSeek R1和kimi的推理模型,QwQ可同時支持深度思考和聯(lián)網(wǎng)搜索,并會展示完整的思維鏈。Qwen團(tuán)隊稱,QWQ-MAX官方版本即將發(fā)布,同步會發(fā)布Android和iOS應(yīng)用程序,還會發(fā)布更小的可在本地設(shè)備部署的模型,如QWQ-32B等。
11月28日,阿里云通義團(tuán)隊發(fā)布全新AI推理模型QwQ-32B-Preview,并同步開源。評測數(shù)據(jù)顯示,預(yù)覽版本的QwQ,已展現(xiàn)出研究生水平的科學(xué)推理能力,在數(shù)學(xué)和編程方面表現(xiàn)尤為出色,整體推理水平比肩OpenAI o1。QwQ(Qwen with Questions)是通義千問Qwen大模型最新推出的實驗性研究模型,也是阿里云首個開源的AI推理模型。阿里云通義千問團(tuán)隊研究發(fā)現(xiàn),當(dāng)模型有足夠的時間思考、質(zhì)疑和反思時,其對數(shù)學(xué)和編程的理解就會深化?;诖?,QwQ取得了解決復(fù)雜問題的突破性進(jìn)展。