5月6日,據(jù)知名科技記者馬克·古爾曼透露,蘋果AI有望在iOS 18.6系統(tǒng)中首次在中國大陸啟用部分功能,背后由阿里和百度提供技術(shù)支持。具體來看,百度的文心一言大模型將作為國行版蘋果AI的核心云端智能引擎。與此同時(shí),為確保AI內(nèi)容符合國內(nèi)法規(guī),蘋果還將引入由阿里提供的審查機(jī)制,對(duì)AI生成內(nèi)容進(jìn)行本地合規(guī)審核。今年2月,阿里聯(lián)合創(chuàng)始人蔡崇信曾確認(rèn)了雙方的合作關(guān)系。
4月28日,理想汽車官宣,自研星環(huán)OS正式開源。據(jù)了解,理想星環(huán)OS是理想汽車的自研汽車操作系統(tǒng),今年3月理想汽車創(chuàng)始人李想宣布該系統(tǒng)將開源,目前第一批開源代碼已登陸理想汽車官網(wǎng)開源論壇。
4月23日,字節(jié)跳動(dòng)開源了多模態(tài)AI Agent UI-TARS的最新1.5版本。與上一代相比,1.5版本在計(jì)算機(jī)使用、瀏覽器使用和手機(jī)使用等基準(zhǔn)測(cè)試中均表現(xiàn)非常出色。在計(jì)算機(jī)使用方面,OSworld測(cè)試得分為42.5,高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1(200步);Windows Agent Arena(50步)得分為42.1,遠(yuǎn)超之前的29.8。瀏覽器使用方面,WebVoyager得分為84.8,接近OpenAI CUA和之前最高水平的87,Online-Mind2web得75.8,優(yōu)于OpenAI CUA的71、Claude 3.7的62.9和之前的71。手機(jī)使用方面,Android World得64.2,高于之前的59.5。
4月21日,RoboSense速騰聚創(chuàng)正式發(fā)布真192線車載高性能數(shù)字化激光雷達(dá)EMX。EMX擁有真192線高線數(shù)掃描,具備每秒高達(dá)288萬點(diǎn)的高清點(diǎn)云、0.08°×0.1°全局角分辨率,提供最遠(yuǎn)300米的探測(cè)距離、最高20Hz幀率,且高度集成,是目前最小巧的車載數(shù)字化主激光雷達(dá)。EMX已獲得多家整車廠定點(diǎn)合作,將于年內(nèi)量產(chǎn)上車。
Google最近發(fā)布了一個(gè)Geospatial Reasoning的代理大模型,根據(jù)介紹Geospatial Reasoning大模型想著重解決的問題:1、地理空間應(yīng)用過程中需要花費(fèi)大量的成本進(jìn)行數(shù)據(jù)以及模型的整合,同時(shí)還需要多領(lǐng)域的專業(yè)知識(shí);2、如何能夠?qū)⒂脩舻臄?shù)據(jù)和Google的數(shù)據(jù)和模型進(jìn)行低成本的整合應(yīng)用;3、Gemini表現(xiàn)出了強(qiáng)大的推理能力,這個(gè)能力有助于解決如上這些問題。
4月8日,火山引擎宣布推出一款名為Data Agent的企業(yè)數(shù)據(jù)智能體。基于大模型的推理、分析和調(diào)用工具等能力,Data Agent能夠深度理解業(yè)務(wù)需求,自動(dòng)化完成撰寫深度研究報(bào)告、營銷活動(dòng)設(shè)計(jì)等任務(wù)。
近日,易智瑞GeoScene 5.1正式發(fā)布。GeoScene 5.1一核六翼產(chǎn)品技術(shù)體系中,核心產(chǎn)品和六大技術(shù)能力都融合了大量智能化功能:一方面針對(duì)時(shí)空數(shù)據(jù)生產(chǎn)、數(shù)據(jù)治理等勞動(dòng)密集型工作,提供自動(dòng)化工具和技術(shù)流程;另一方面提供更豐富的智能化算法,實(shí)現(xiàn)時(shí)空大數(shù)據(jù)的高效精準(zhǔn)分析挖掘;再者隨著生成式AI技術(shù)日新月異的發(fā)展,GeoScene也探索結(jié)合語言、視覺以及多模態(tài)大模型,助力用戶智能化升級(jí)邁向最前沿。
近日,PICO OS 5.13.0.U版本更新正式開始向PICO 4 Ultra用戶推送。據(jù)了解,在最新的 PICO OS 5.13.0.U 版本系統(tǒng)中,用戶可以在開發(fā)者選項(xiàng)中針對(duì)單個(gè)應(yīng)用進(jìn)行刷新率、分辨率、硬件功耗等方面的設(shè)定。在《PICO 互聯(lián)》中增添了串流插幀功能,提升了一體機(jī)應(yīng)用與串流應(yīng)用的顯示畫質(zhì)效果。同時(shí),相冊(cè)新增了將 2D 照片一鍵轉(zhuǎn)換為 3D 空間照片的功能,讓曾經(jīng)記錄的美好瞬間呈現(xiàn)出立體感,并且支持觀看 iPhone 16 系列手機(jī)拍攝的空間照片。
3月27日,車載智能空間AIOS全棧技術(shù)提供商弋途(深圳)科技有限公司宣布完成數(shù)千萬元Pre-A輪融資。本輪由徐匯資本領(lǐng)投,德寧資本、云啟資本跟投,資金將重點(diǎn)投入汽車垂域大模型及智能空間AIOS系統(tǒng)研發(fā),推動(dòng)量產(chǎn)項(xiàng)目批量交付,領(lǐng)跑車載AI全棧能力商業(yè)化落地。
蘋果公司目前宣布,第36屆全球開發(fā)者大會(huì)(WWDC 2025)將于北京時(shí)間6月10日至14日舉行。根據(jù)彭博社報(bào)道,此次的WWDC 2025將會(huì)有諸多的看點(diǎn)。首先是發(fā)布visionOS 3,眾所周知在WWDC 2023上蘋果推出了該公司的首款空間計(jì)算設(shè)備Vision Pro以及空間操作系統(tǒng)visionOS,在WWDC 2024上,蘋果公司則是推出了visionOS的第二個(gè)大版本visionOS 2,依次類推的話,今年的WWDC 2025就應(yīng)該發(fā)布visionOS 3。接下來可能就是披露索尼PSVR2的控制器支持Vision Pro的進(jìn)展情況。在去年彭博社就報(bào)道稱蘋果公司在2024年早些時(shí)候就有接觸索尼,雙方同意合作在Vision Pro上推出對(duì)PSVR2控制器的支持。內(nèi)部人士稱,在索尼這項(xiàng)控制器適配Vision Pro的工作已經(jīng)持續(xù)了好幾個(gè)月了。
全球化客戶服務(wù)AI Agent企業(yè)Shulex近日完成新一輪億元級(jí)融資,由盛大資本領(lǐng)投,北極光創(chuàng)投、Starting Gate Fund跟投,非凡資本擔(dān)任獨(dú)家財(cái)務(wù)顧問。新的融資將用于加速大模型驅(qū)動(dòng)的AI數(shù)字員工開發(fā),擴(kuò)大全球業(yè)務(wù)版圖,并加快實(shí)現(xiàn)AI Agent大規(guī)模釋放人類生產(chǎn)力的使命。
3月20日,OpenAI進(jìn)行了技術(shù)直播發(fā)布了三款全新語音模型,專用于開發(fā)語音AI Agent。兩個(gè)是語音轉(zhuǎn)文本模型GPT-40 Transcribe和GPT-4 Mini Transcribe;一個(gè)是文本轉(zhuǎn)語音模型GPT-40 Mini TTS。OpenAI還特意開發(fā)了一個(gè)新網(wǎng)站來展示新功能。
據(jù)IPO早知道消息,在3月18日舉行的范式集團(tuán)發(fā)布會(huì)上,范式集團(tuán)創(chuàng)始人戴文淵發(fā)布全新的集團(tuán)Logo,并分享了范式集團(tuán)的 AGI 愿景與實(shí)現(xiàn)路徑。戴文淵強(qiáng)調(diào):“范式集團(tuán)未來將用‘AI Agent+世界模型’的技術(shù)路徑去賦能更多的產(chǎn)業(yè),最終將大量垂直的智能能力匯聚成為 AGI。”
3月11日,OpenAI舉行了一個(gè)19分鐘的線上發(fā)布會(huì),推出全新Agent工具,OpenAI直接祭出自研Agent SDK和Responses API兩大殺器!旨在徹底簡(jiǎn)化agent開發(fā)流程,讓開發(fā)者和企業(yè)都能輕松構(gòu)建實(shí)用又可靠的智能體。Responses API集成了Chat Completions的簡(jiǎn)潔和Assistants API的工具調(diào)用能力,內(nèi)置網(wǎng)頁搜索、文件搜索、電腦控制等硬核工具,一個(gè)API call就能搞定復(fù)雜任務(wù)重磅推出開源Agent SDK,多智能體workflow編排、agent行為追蹤、安全監(jiān)控統(tǒng)統(tǒng)不在話下,對(duì)比之前的Swarm SDK,簡(jiǎn)直是性能和易用性雙重飛躍。
據(jù)創(chuàng)新工場(chǎng)官微,近日,面向全球的Multi-Autonomous Agents解決方案廠商“未來式智能”宣布完成數(shù)千萬元天使輪輪融資,由麟閣創(chuàng)投領(lǐng)投,薊門資管跟投、老股東創(chuàng)新工場(chǎng)持續(xù)跟投。融資資金將主要用于產(chǎn)品研發(fā),及市場(chǎng)拓展和組織運(yùn)營。未來式智能(AutoAgents.ai)成立于2023年6月,致力于為全球企業(yè)提供自主智能體(AI Agents)以及智能助理(Copilot)軟件服務(wù),以提高人們的工作效率。
西湖大學(xué)AGI實(shí)驗(yàn)室張馳團(tuán)隊(duì)日前推出AppAgentX——一款具備自我進(jìn)化能力的GUI代理。據(jù)介紹,它能夠在不斷執(zhí)行任務(wù)的過程中學(xué)習(xí)并優(yōu)化自身的行為模式,實(shí)現(xiàn)更加高效的操作。從實(shí)驗(yàn)結(jié)果來看,AppAgentX從單步的執(zhí)行效率到總體的API token消耗,在多個(gè)GUI交互任務(wù)上展現(xiàn)出了顯著的“降本增效”。
日前,一支來自中國的團(tuán)隊(duì)正式對(duì)外發(fā)布通用型AI Agent產(chǎn)品Manus。據(jù)團(tuán)隊(duì)介紹,Manus在GAIA基準(zhǔn)測(cè)試中取得了SOTA(State-of-the-Art)的成績(jī),顯示其性能超越OpenAI的同層次大模型。從發(fā)布的視頻演示來看,Manus在接到用戶指令后可以直接操作電腦完成一系列報(bào)告撰寫、表格制作等工作,并在最后導(dǎo)出符合用戶需求的產(chǎn)品。
2月26日消息,今天凌晨3點(diǎn),微軟在官網(wǎng)開源了多模態(tài)AI Agent基礎(chǔ)模型——Magma。與傳統(tǒng)Agent相比,Magma具備跨數(shù)字、物理世界的多模態(tài)能力,能自動(dòng)處理圖像、視頻、文本等不同類型數(shù)據(jù),例如,用戶可以用Magma來自動(dòng)下電商訂單、查詢天氣;也可以自動(dòng)操作實(shí)體機(jī)器人,或者下真實(shí)象棋時(shí)獲得幫助。此外,Magma還能內(nèi)置了心理預(yù)測(cè)功能,增強(qiáng)了對(duì)未來視頻幀中時(shí)空動(dòng)態(tài)的理解能力,能夠準(zhǔn)確推測(cè)視頻中人物或物體的意圖和未來行為。
2月24日,百度集團(tuán)公告,公司董事會(huì)已任命劉曉丹接替Brent Callinicos擔(dān)任新獨(dú)立董事及董事會(huì)審計(jì)委員會(huì)主席,于2025年2月23日生效。Callinicos已因個(gè)人原因辭任獨(dú)立董事及董事會(huì)審計(jì)委員會(huì)主席職位。Callinicos的辭任并非因與公司產(chǎn)生任何糾紛或分歧。
國家管網(wǎng)集團(tuán)于2月10日完成了滿血版DeepSeek模型的私有化部署,正在結(jié)合DeepSeek新技術(shù)和AI Agent(人工智能體)的深化應(yīng)用,升級(jí)重塑行業(yè)大模型全新架構(gòu),助力“全國一張網(wǎng)”建設(shè)運(yùn)營,進(jìn)一步提升國家能源安全保障能力。西氣東輸公司通過采購成熟的AI Agent協(xié)同平臺(tái)配套軟件,并協(xié)同智網(wǎng)數(shù)科技術(shù)力量支持,實(shí)現(xiàn)了基于“管網(wǎng)大模型”底座的平臺(tái)技術(shù)架構(gòu)拆分與優(yōu)化部署,搭建了國家管網(wǎng)集團(tuán)首個(gè)統(tǒng)一AI Agent協(xié)同平臺(tái)——WeAgent智能體平臺(tái)。目前,該平臺(tái)已通過安全檢查及滲透測(cè)試,初步具備了大模型、插件、數(shù)據(jù)庫及知識(shí)庫等能力,正在進(jìn)行進(jìn)一步的功能完善,不久之后就會(huì)在WeACT工作臺(tái)中向廣大員工開放使用權(quán)限。