當?shù)貢r間8月26日,谷歌正式推出了其最先進的圖像生成與編輯模型Gemini 2.5 Flash Image,代號“納米香蕉”(nano banana)。該模型當前在LMArena基準測試中位列AI圖像編輯模型榜首,具備角色一致性保持、自然語言精準修圖、多圖融合能力,并利用Gemini世界知識提升智能表現(xiàn)。目前用戶可通過Gemini App、API等方式訪問,其API定價為每百萬輸出token30美元。
4月15日,HiDream智象未來團隊宣布正式開源圖像生成大模型HiDream-I1與交互編輯模型HiDream-E1。HiDream-I1在權威榜單Artificial Analysis中24小時內登頂,成為首個躋身全球第一梯隊的中國自研生成式AI模型,并在圖像質量、語義理解、藝術表現(xiàn)三大維度刷新行業(yè)紀錄,實現(xiàn)圖像的多風格生成,涵蓋動漫、肖像、科幻等場景。目前,設計工具Recraft已集成HiDream模型,用戶3步即可實現(xiàn)“一鍵出圖+智能編輯”。
4月11日,獨立AI基準測試與分析平臺Artificial Analysis最新競技場榜單揭曉,智象未來的圖像生成大模型HiDream-I1開源僅24小時就登頂圖像生成模型榜首,成為首個登頂該榜單的中國自研生成式AI模型。據(jù)介紹,HiDream-I1已參與 5000 余次測評,覆蓋“文字排版”“人物肖像”“動漫”“科幻題材” 等多個關鍵細分領域。