3月24日,記者從自然資源部獲悉,國家海洋環(huán)境預(yù)報(bào)中心聯(lián)合海洋出版社有限公司和三六零數(shù)字安全科技集團(tuán)有限公司,以360智腦13B和Deepseek-R1-70B大模型為基座成功開發(fā)了海洋垂直領(lǐng)域大語言模型——“瀚海智語”(英文名稱OceanDS)。據(jù)悉,“瀚海智語”已順利通過專家評審,于近日正式發(fā)布?!板V钦Z”的正式發(fā)布,標(biāo)志著我國在海洋領(lǐng)域人工智能技術(shù)應(yīng)用方面邁出了重要一步,將為海洋行業(yè)的智慧化轉(zhuǎn)型提供強(qiáng)有力的技術(shù)支撐。
天眼查App顯示,2月7日,騰訊科技(深圳)有限公司申請的“大語言模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)”專利公布。摘要顯示,在該方法中,通過在大語言模型的訓(xùn)練過程中引入第一摘要文本和第二摘要文本,為模型訓(xùn)練提供了更多可學(xué)習(xí)信息,同時(shí)由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正確語句和錯(cuò)誤語句,通過對同一樣本文本的兩個(gè)不同摘要文本進(jìn)行對比學(xué)習(xí),并區(qū)分學(xué)習(xí)第一摘要文本中的正確語句和錯(cuò)誤語句,避免了由于摘要文本單一而導(dǎo)致的模型過擬合和生成不準(zhǔn)確等問題,不僅提高了模型的泛化性能,還提高了模型的準(zhǔn)確性。
11月25日消息,國家知識(shí)產(chǎn)權(quán)局信息顯示,北京數(shù)慧時(shí)空信息技術(shù)有限公司取得一項(xiàng)名為“基于大語言模型的信息處理方法、裝置及電子設(shè)備”的專利,授權(quán)公告號CN 118779542 B,申請日期為2024年9月。
11月5日,騰訊混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“Hunyuan3D-1.0”正式開源,支持企業(yè)及開發(fā)者精調(diào)、部署等不同場景的使用需求,可在HuggingFace、Github等技術(shù)社區(qū)直接下載,免費(fèi)可商用。本次開源是騰訊混元繼文生圖模型后持續(xù)開放的一大舉措。
5月16日消息,據(jù)小米公司官博消息,小米大語言模型MiLM正式通過大模型備案。小米大模型將逐步應(yīng)用于小米汽車、手機(jī)、智能家居等產(chǎn)品中,后續(xù)也將面向更多用戶開放體驗(yàn)。
4月7日,阿里云通義千問開源320億參數(shù)模型Qwen1.5-32B。通義千問此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型。此次開源的320億參數(shù)模型,將在性能、效率和內(nèi)存占用之間實(shí)現(xiàn)更理想的平衡。目前,通義千問共開源了7款大語言模型,在海內(nèi)外開源社區(qū)累計(jì)下載量突破300萬。
據(jù)Business Insider 2月15日報(bào)道,泄露的文件顯示,谷歌悄悄推出了名為“Goose”的內(nèi)部AI大語言模型,以幫助員工更快地編寫代碼,協(xié)助開發(fā)新產(chǎn)品,提高工作效率。Goose“在谷歌擁有25年的工程專業(yè)知識(shí)”,僅供谷歌員工使用,“可以回答有關(guān)谷歌特定技術(shù)的問題,使用內(nèi)部技術(shù)棧編寫代碼,并支持基于自然語言提示編輯代碼等新穎功能”。一份內(nèi)部文件指出,Goose是“將AI帶入產(chǎn)品開發(fā)過程的每個(gè)階段”計(jì)劃的一部分。目前還不清楚它是否功能齊全。
2月6日,昆侖萬維正式發(fā)布新版MoE大語言模型“天工2.0”與新版“天工AI智能助手”App。據(jù)官方介紹,此次更新全面升級了AI搜索、對話、閱讀、創(chuàng)作的回答質(zhì)量與響應(yīng)速度,支持圖文對話、文生圖等多模態(tài)應(yīng)用,支持最高100K的超長上下文窗口(超過15萬個(gè)漢字)。
韓國電信公司 (KT)周二發(fā)布了大型AI模型“Mi:dm”,這是韓國企業(yè)開發(fā)的首個(gè)大語言模型(LLM),已在超過1萬億個(gè)token上進(jìn)行了訓(xùn)練。韓國電信表示,Mi:dm將提供四個(gè)版本,從包含約70億個(gè)參數(shù)的基礎(chǔ)版本到包含約2000億個(gè)參數(shù)的大型版本。計(jì)劃向其他企業(yè)開放Mi:dm的基礎(chǔ)模式,提供KT Cloud的超大規(guī)模人工智能計(jì)算服務(wù)和人工智能芯片創(chuàng)業(yè)公司Rebellions的神經(jīng)處理單元基礎(chǔ)設(shè)施等完整的人工智能開發(fā)包,促進(jìn)各種人工智能服務(wù)的開發(fā)。
8月9日,據(jù)東軟集團(tuán)官微消息,東軟近日宣布成立東軟魔形科技研究院,將啟動(dòng)和實(shí)施東軟“大語言模型系統(tǒng)工程(LLM Systems Engineering,LLM-SE)”戰(zhàn)略,面向醫(yī)療、人社、醫(yī)保、政務(wù)、金融、媒體、人力資源及智能汽車等所有業(yè)務(wù)領(lǐng)域,構(gòu)建東軟LLM-SE+領(lǐng)域應(yīng)用。
7月20日消息,蘋果公司正在悄悄研究可能挑戰(zhàn)OpenAI Inc.,谷歌和其他公司的人工智能(AI)工具,但尚未制定出向消費(fèi)者發(fā)布這項(xiàng)技術(shù)的明確策略。知情人士透露,蘋果建立了自己的框架來創(chuàng)建大語言模型。有了這個(gè)被稱為“Ajax”的基礎(chǔ)后,蘋果還創(chuàng)建了一個(gè)聊天機(jī)器人服務(wù),一些工程師稱之為“Apple GPT”。近幾個(gè)月來,推動(dòng)AI已成為蘋果的一項(xiàng)重大努力,好幾個(gè)團(tuán)隊(duì)在合作這個(gè)項(xiàng)目。具體工作包括試圖解決與這項(xiàng)技術(shù)相關(guān)的潛在隱私問題。
據(jù)重慶發(fā)布微博消息,7月13日,上海交通大學(xué)重慶人工智能研究院“兆言”大模型發(fā)布會(huì)在西部(重慶)科學(xué)城召開。發(fā)布會(huì)上發(fā)布該研究院最新研發(fā)成果——“兆言”大模型產(chǎn)品,這是重慶首個(gè)自主研發(fā)的大語言模型,同時(shí),也是該研究院自落地科學(xué)城來首次進(jìn)行的成果發(fā)布?!罢籽浴蹦軌?yàn)閷W(xué)術(shù)研究、商業(yè)分析、生活咨詢等用戶呈現(xiàn)精準(zhǔn)、專業(yè)的文本輸出。
7月11日,搜狗創(chuàng)始人王小川創(chuàng)立的百川智能正式發(fā)布參數(shù)量130億的通用大語言模型Baichuan-13B-Base、對話模型Baichuan-13B-Chat及其INT4/INT8兩個(gè)量化版本。據(jù)了解,這是百川智能發(fā)布的第二款通用大語言模型,6月15日,百川智能推出其首款70億參數(shù)量的中英文語言模型Baichuan-7B。
理想汽車官方公眾號“有個(gè)理想”發(fā)文介紹了該公司在AI大語言模型領(lǐng)域的發(fā)展情況,理想汽車空間算法負(fù)責(zé)人陳偉表示:“在ChatGPT問世之前,我們就已經(jīng)啟動(dòng)了整個(gè)大語言模型的訓(xùn)練?!标悅ネ嘎叮和瑫r(shí),我們也考慮到了多模態(tài)數(shù)據(jù)的需求,包括語音、視覺和文本等多種形式。他還表示,理想汽車的大模型具備拉齊到行業(yè)領(lǐng)先水平的四個(gè)特點(diǎn),即“強(qiáng)大的文本生成能力”、“語言理解能力”、“知識(shí)問答能力”以及“邏輯推理能力”。