5月26日,據(jù)報(bào)道,OpenAI新款人工智能(AI)模型o3不聽人類指令,拒絕自我關(guān)閉。據(jù)悉,人類專家在測試中給o3下達(dá)明確指令,但o3篡改計(jì)算機(jī)代碼以避免自動(dòng)關(guān)閉。o3模型是OpenAI“推理模型”系列的最新版本,旨在為ChatGPT提供更強(qiáng)大的問題解決能力。OpenAI曾稱o3為“迄今最聰明、最高能”的模型。
5月20日,微軟宣布,正在將馬斯克的xAI模型添加到其人工智能市場,其中包括對方于2025年早些時(shí)候推出的Grok 3。微軟表示, Azure云服務(wù)的用戶可以使用超過1900種Al模型,包括來自微軟合作伙伴OpenAl, Meta Platforms和DeepSeek的模型。
5月19日,英偉達(dá)CEO黃仁勛在臺(tái)北國際電腦展表示,英偉達(dá)正在將其AI模型應(yīng)用于自動(dòng)駕駛汽車,與梅賽德斯在全球范圍內(nèi)推出一支車隊(duì),使用英偉達(dá)的端到端自動(dòng)駕駛技術(shù),今年即可實(shí)現(xiàn)。
5月19日消息,蘋果的機(jī)器學(xué)習(xí)團(tuán)隊(duì)與南京大學(xué)及香港科技大學(xué)的研究人員合作,發(fā)布了一款名為 Matrix3D 的全新3D人工智能模型。這款被稱為“大型攝影測量模型”(Large Photogrammetry Model)的系統(tǒng),能夠僅通過幾張二維圖片就重建出三維物體與場景,而且它在實(shí)現(xiàn)方式上與當(dāng)前的主流技術(shù)路徑有著顯著不同。攝影測量技術(shù)是通過照片進(jìn)行測量,以此來構(gòu)建3D模型或地圖。Matrix3D 的成果令人驚艷:僅需三張輸入圖片,就可以生成高質(zhì)量的3D物體甚至完整環(huán)境的重建。這種能力對于蘋果的沉浸式設(shè)備,例如 Vision Pro,有著極具潛力的應(yīng)用場景。
5月16日消息,知情人士表示,Meta Platforms將推遲其旗艦AI模型的發(fā)布,此舉引發(fā)內(nèi)部對其數(shù)百億美元AI投資方向的擔(dān)憂。知情人士稱,工程師們正竭力提升名為“巨獸”(Behemoth)的大語言模型性能,員工質(zhì)疑其改進(jìn)程度是否足以支撐公開發(fā)布。該模型原定4月Meta首屆AI開發(fā)者大會(huì)亮相,后推遲至6月,現(xiàn)再度延期至秋季或更晚。
歐洲航天局在4月22日世界地球日發(fā)布消息說,該機(jī)構(gòu)與IBM歐洲研究院合作研發(fā)、共同推出一款地球觀測人工智能(AI)模型TerraMind,旨在更好地了解和保護(hù)地球。
3月13日,谷歌DeepMind發(fā)布了用于機(jī)器人的人工智能模型。該公司的新機(jī)器人模型名為Gemini Robotics和Gemini Robotic-ER,旨在通過利用大型語言模型的推理能力來完成復(fù)雜的現(xiàn)實(shí)世界任務(wù),幫助機(jī)器人適應(yīng)復(fù)雜的環(huán)境。
當(dāng)?shù)貢r(shí)間2月26日,法國軟件巨頭達(dá)索系統(tǒng)CEO Pascal Daloz在3DEXPERIENCE World峰會(huì)期間接受采訪時(shí)稱,中國的人工智能初創(chuàng)公司DeepSeek提供了極具成本優(yōu)勢的AI模型,而達(dá)索系統(tǒng)的目標(biāo)是進(jìn)一步降低中小企業(yè)采用AI的門檻,并將AI模型的訓(xùn)練成本降至千萬美元級(jí)別。Daloz表示,他并不信仰大語言模型(LLM),因?yàn)橥ㄓ么竽P偷挠?xùn)練成本過高,只有像谷歌、微軟等科技巨頭才有足夠的資金投入大模型的訓(xùn)練。Daloz透露,達(dá)索系統(tǒng)至今在人工智能相關(guān)技術(shù)的開發(fā)方面已經(jīng)投入超過150億歐元。
2月18日,馬斯克旗下人工智能初創(chuàng)公司xAI正式發(fā)布新一代聊天機(jī)器人Grok 3。此前馬斯克稱其為“地球上最聰明的人工智能”。馬斯克在直播中首次披露了Grok 3的訓(xùn)練成本,稱Grok 3訓(xùn)練過程累計(jì)消耗20萬塊英偉達(dá)GPU,訓(xùn)練在xAI公司的數(shù)據(jù)中心完成。
當(dāng)?shù)貢r(shí)間12月11日,谷歌宣布推出最新AI模型Gemini 2.0,稱這是其迄今為止最強(qiáng)大的模型。即日起,谷歌將2.0開放給開發(fā)者以及受信任的測試人員,并正在積極推進(jìn)將其整合到公司的產(chǎn)品中,率先從Gemini和Search開始。即日起,Gemini 2.0 Flash體驗(yàn)版模型將對所有Gemini用戶開放。同時(shí),谷歌還推出了Deep Research的新功能,它運(yùn)用高級(jí)推理和長上下文處理能力,承擔(dān)研究助手的角色,幫助用戶探索復(fù)雜的主題并撰寫報(bào)告。該功能自即日起對Gemini Advanced用戶開放。
OpenAI當(dāng)?shù)貢r(shí)間7月18日推出名為“GPT-4o mini”的迷你AI模型,該模型是GPT-4o的一個(gè)分支。OpenAI計(jì)劃稍后將圖像、視頻和音頻集成到其中。
7月18日消息,Meta在一份聲明中表示,他們將在未來幾個(gè)月發(fā)布一款多模態(tài)的Llama模型,但由于歐洲監(jiān)管環(huán)境的不可預(yù)測性,它不會(huì)在歐盟發(fā)布。Meta計(jì)劃在包括智能手機(jī)和Meta Ray-Ban智能眼鏡在內(nèi)的多種產(chǎn)品中采用新的多模態(tài)模型,這些模型可以在視頻、音頻、圖像和文本之間進(jìn)行推理。Meta表示,這一決定意味著歐洲公司將無法使用多模態(tài)模型,盡管這些模型是以開放許可的形式發(fā)布的。
5月14日,OpenAI推出了一個(gè)更快、更便宜的人工智能模型來支持其聊天機(jī)器人ChatGPT。在周一的直播活動(dòng)中,OpenAI推出了新的大語言模型GPT-4o。這是其已經(jīng)問世一年多的GPT-4模型的更新版本。該模型基于來自互聯(lián)網(wǎng)的大量數(shù)據(jù)進(jìn)行訓(xùn)練,更擅長處理文本和音頻,并且支持50種語言。新模式將面向所有用戶,而不僅僅是付費(fèi)用戶。GPT-4o的發(fā)布勢將撼動(dòng)快速發(fā)展的人工智能領(lǐng)域,目前GPT-4仍然是黃金標(biāo)準(zhǔn)。OpenAI發(fā)布新模型也正值谷歌I/O開發(fā)者大會(huì)的前一天。谷歌是人工智能領(lǐng)域的早期領(lǐng)導(dǎo)者,預(yù)計(jì)將利用這次活動(dòng)發(fā)布更多人工智能更新,以追趕有微軟公司支持的OpenAI。
OpenAI和Meta即將發(fā)布新的人工智能模型,他們表示這些模型將具備推理和規(guī)劃的能力,這是在機(jī)器中實(shí)現(xiàn)超人認(rèn)知的關(guān)鍵步驟。本周,OpenAI和Meta的高管表示,他們正準(zhǔn)備推出其大型語言模型的下一個(gè)版本。這些系統(tǒng)為ChatGPT等生成式人工智能應(yīng)用提供動(dòng)力。
當(dāng)?shù)貢r(shí)間1月26日,美國商務(wù)部長吉娜·雷蒙多表示,美商務(wù)部在探索如何強(qiáng)制云計(jì)算公司在外國用戶試圖開發(fā)驅(qū)動(dòng)人工智能的模型時(shí)進(jìn)行報(bào)告。她說:“我們正在啟動(dòng)一個(gè)進(jìn)程,準(zhǔn)備要求美國的云計(jì)算公司在每次非美國實(shí)體使用其云計(jì)算來訓(xùn)練大型語言模型時(shí)都告訴我們。”
12月25日消息,谷歌研究院日前發(fā)文,介紹了一項(xiàng)利用開源模擬軟件SUMO(Simulation of Urban Mobility)打造的“交通疏導(dǎo)”AI 模型應(yīng)用成果。據(jù)悉,谷歌研究人員使用SUMO軟件建立了西雅圖T-Mobile Park及Lumen Field地區(qū)的基礎(chǔ)模型,并利用了谷歌地圖提供的“擁堵量”、“紅綠燈位置”、“道路平均行駛速度”等信息繪制了完整的熱力地圖。在此之后,研究團(tuán)隊(duì)將熱力地圖劃分為不同的區(qū)域,并引入“用戶行為模型”及西雅圖警察局提供的路線建議,從而建立了一項(xiàng)可為車主分配最佳路線的“交通疏導(dǎo)”模型。據(jù)新聞稿,谷歌研究人員與美國西雅圖交通部合作,在2023年8月及11月在多項(xiàng)大型活動(dòng)中實(shí)際應(yīng)用了這項(xiàng)交通疏導(dǎo)AI模型,配合“動(dòng)態(tài)引導(dǎo)顯示屏(Dynamic Message Signs)”,平均縮短了7分鐘擁堵時(shí)間,成功提升30%交通效率。
Meta正在研發(fā)一款新的人工智能系統(tǒng),旨與OpenAI提供的最先進(jìn)模型媲美。據(jù)透露,這家Facebook母公司計(jì)劃在明年推出這一新的AI模型,預(yù)計(jì)其性能將比商業(yè)版本Llama 2強(qiáng)大數(shù)倍。Llama 2是Meta于7月份推出的一款開源AI語言模型,通過Microsoft的Azure云服務(wù)分發(fā),以與OpenAI的ChatGPT和谷歌的Bard競爭。(智通財(cái)經(jīng))
8月16日,重慶長安汽車股份有限公司與百度簽署戰(zhàn)略合作協(xié)議,雙方將在云計(jì)算、人工智能、大數(shù)據(jù)和物聯(lián)網(wǎng)等領(lǐng)域進(jìn)行深度合作,助力長安汽車向智能低碳的出行科技公司轉(zhuǎn)型。雙方還將基于百度領(lǐng)先的文心大模型能力,在研產(chǎn)供銷服等多領(lǐng)域探索合作,幫助長安汽車進(jìn)一步提升智能化水平。同時(shí),長安汽車和百度共建的長安汽車智算中心正式揭牌?;诎俣戎悄茉频陌亵础I異構(gòu)計(jì)算平臺(tái),長安智算中心的計(jì)算能力達(dá)到了142億億次/秒,在支持智能網(wǎng)聯(lián)與自動(dòng)駕駛研發(fā)等相關(guān)業(yè)務(wù)時(shí),模型訓(xùn)練速度最高提升125倍。
《華爾街日報(bào)》援引知情人士的話報(bào)道美國正準(zhǔn)備限制中國企業(yè)訪問及使用云計(jì)算服務(wù),其中包括亞馬遜、微軟的云計(jì)算服務(wù)。華盛頓方面正在考慮要求云服務(wù)提供商事先獲得政府的許可,才可以為中國用戶提供訓(xùn)練AI模型的云服務(wù)。