亚洲熟妇av一区二区三区,亚洲av中文无码乱人伦在线视色,亚洲人成网站色www,亚洲欧美日韩国产综合在线一区 ,亚洲av之男人的天堂网站

搜索中心

美團發(fā)布并開源大模型LongCat-Flash-Chat

分享至

9月1日,美團正式發(fā)布并開源大模型LongCat-Flash-Chat。LongCat-Flash采用創(chuàng)新性混合專家模型(Mixture-of-Experts, MoE)架構(gòu),總參數(shù)560B,激活參數(shù)18.6B-31.3B(平均 27B),實現(xiàn)計算效率與性能的雙重優(yōu)化。據(jù)多項基準(zhǔn)測試綜合評估,LongCat-Flash-Chat在僅激活少量參數(shù)的前提下,在智能體任務(wù)中具備突出優(yōu)勢,同時推理速度超過100tps。

中國首個海洋領(lǐng)域開源大模型OceanGPT(滄淵)在杭州發(fā)布

分享至

6月26日,中國首個海洋領(lǐng)域開源大模型OceanGPT(滄淵)在杭州發(fā)布。該大模型由海洋精準(zhǔn)感知技術(shù)全國重點實驗室(浙江大學(xué))牽頭研發(fā),具備基礎(chǔ)的海洋專業(yè)知識問答,以及聲吶圖像、海洋觀測圖等海洋特色多模態(tài)數(shù)據(jù)的自然語言解讀能力。其采用的領(lǐng)域知識增強“慢思考”推理機制,相較現(xiàn)有通用大模型能有效降低幻覺式錯誤。此外,模型還適用于海洋機器人操控與水下具身智能等關(guān)鍵場景。

清華團隊開源大模型推理引擎“赤兔Chitu”

分享至

3月14日,清華大學(xué)高性能計算研究所翟季冬教授團隊與清華系科創(chuàng)企業(yè)清程極智聯(lián)合宣布,開源大模型推理引擎“赤兔Chitu”,該引擎首次實現(xiàn)在非英偉達(dá)Hopper架構(gòu)GPU及各類國產(chǎn)芯片上原生運行FP8精度模型,為國產(chǎn)AI芯片的廣泛應(yīng)用和生態(tài)建設(shè)帶來了新的突破。清程極智CEO湯雄超表示,當(dāng)前國內(nèi)在推理引擎這一核心環(huán)節(jié),仍缺乏生產(chǎn)級開源產(chǎn)品。開源‘赤兔’引擎是助力國內(nèi)AI生態(tài)建設(shè)的重要一步。

工信部:三家基礎(chǔ)電信企業(yè)均全面接入DeepSeek開源大模型

分享至

據(jù)“工信微報”2月8日消息,中國移動、中國電信、中國聯(lián)通三家基礎(chǔ)電信企業(yè)均已全面接入DeepSeek開源大模型。工業(yè)和信息化部運行監(jiān)測協(xié)調(diào)局介紹,2025年春節(jié)期間,基礎(chǔ)電信企業(yè)力推最新AI技術(shù)普惠應(yīng)用,三家基礎(chǔ)電信企業(yè)均已全面接入DeepSeek開源大模型,實現(xiàn)在多場景、多產(chǎn)品中應(yīng)用,針對熱門的DeepSeek-R1模型提供專屬算力方案和配套環(huán)境,助力國產(chǎn)大模型性能釋放。

浪潮信息發(fā)布“源2.0-M32”開源大模型

分享至

5月28日消息,浪潮信息發(fā)布了“源2.0-M32” 開源大模型。該模型在源2.0系列大模型基礎(chǔ)上,采用了“基于注意力機制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建包含32個專家的混合專家模型(MoE),并大幅提升模型算力效率。M32憑借特別優(yōu)化設(shè)計的模型架構(gòu),在僅激活37億參數(shù)的情況下,取得了和700億參數(shù)LLaMA3相當(dāng)?shù)男阅芩剑乃懔H為LLaMA3的1/19。

昇騰社區(qū)回應(yīng)華為發(fā)布會被指造假:是讀取外部開源大模型實時生成的圖片

分享至

針對網(wǎng)傳華為發(fā)布會大模型生成圖片疑人工操控的消息,昇騰社區(qū)回應(yīng):5月10日,在鯤鵬昇騰開發(fā)者大會的一場技術(shù)討論上,演示了mxRAG SDK功能。本次演示面向開發(fā)者,展示如何通過十幾行代碼即可完成RAG應(yīng)用開發(fā)?,F(xiàn)場圖片為實時生成,調(diào)用的是開源大模型。代碼中有time.sleep(6)等表述,是命令等待讀取外部開源大模型實時生成的圖片,并非調(diào)取預(yù)置圖片。本次展示的均為真實代碼,也將在昇騰社區(qū)上開放,歡迎開發(fā)者使用并提出寶貴建議。

全球最強開源大模型Llama 3發(fā)布:使用15T數(shù)據(jù)預(yù)訓(xùn)練,最大模型參數(shù)將超4000億

分享至

當(dāng)?shù)貢r間周四,美國科技巨頭Meta推出了其最強大的開源人工智能(AI)模型Llama 3,以追趕行業(yè)領(lǐng)導(dǎo)者OpenAI。 Meta首席執(zhí)行官扎克伯格聲稱,Llama 3有8B和70B兩個版本,大版本的Llama 3將有超過4000億參數(shù)。由于預(yù)訓(xùn)練和指令微調(diào),Llama 3相比Llama 2有了極大的改進。

李彥宏再給開源大模型潑冷水,稱大模型領(lǐng)域開源最貴

分享至

4月16日,百度AI開發(fā)者大會上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏再次表達(dá)了他對大模型開閉源之爭的看法。李彥宏表示,因為有了文心4.0基礎(chǔ)模型,可以根據(jù)需要兼顧效果、響應(yīng)速度、推理成本等考慮裁減出適合各種場景的小尺寸模型。通過降維裁減出來的模型, 比直接拿開源模型調(diào)出來的模型,在同等尺寸下效果更好,在同等效果下成本明顯更低。“以前說開源便宜,其實在大模型領(lǐng)域,開源是最貴的。所以開源模型會越來越落后?!崩顝┖攴Q。