天天百事通!華為輪值董事長胡厚崑:盤古大模型 3.0 將于 7 月 7 日發(fā)布
IT之家 7 月 6 日消息,此前市場有消息稱華為大模型“盤古 Chat”已申請相關商標,將于 7 月 7 日發(fā)布,而華為官方表示不會有“盤古 Chat”此類命名。
(資料圖片)
華為輪值董事長胡厚崑出席參加了今日 2023 世界人工智能大會開幕式并發(fā)了表演講。他 表示:華為將在 7 月 7 日的華為云開發(fā)者大會上推出盤古大模型 3.0。
據(jù)介紹,從通用大模型走向行業(yè)大模型。基礎大模型,行業(yè)大模型,場景模型。盤古大模型已經(jīng)深耕行業(yè) 10+,業(yè)務場景 400+。
他表示,去年年底 ChatGPT 的出現(xiàn),把人工智能推向了新的風口。人工智能將幫助我們改寫身邊的一切。
他介紹了華為在人工智能方面的布局,在深耕算力方面實現(xiàn)了架構創(chuàng)新、發(fā)展生態(tài)、共建算力;在架構創(chuàng)新上重新定義計算架構,對等平構架構節(jié)點性能提升 30%,昇騰 AI 集群效率提升 10%。
此外,華為在發(fā)展生態(tài)上還聯(lián)合 5700 + 鯤鵬 / 昇騰合作伙伴,以及硬件合作伙伴 30+,實現(xiàn)了國內大模型近一半創(chuàng)新使能,包括場景化系列 AI 硬件 100+,孵化 / 適配大模型 30+,鯤鵬 / 昇騰開發(fā)者 380 萬 +。
在共建算力方面,他表示華為已經(jīng)在構建城市算力基礎設施,幫助各地政府打造了 25 個昇騰人工智能計算中心。
IT之家查詢公開資料獲悉,華為盤古系列基礎大模型于 2021 年正式對外發(fā)布,包括 NLP(自然語言處理)、CV(機器視覺)和科學計算大模型;后續(xù)又發(fā)布了礦山、藥物分子、氣象、海浪等行業(yè)大模型。
據(jù)介紹,NLP 是首個千億參數(shù)中文預訓練大模型,CV 大模型則首次達到 30 億參數(shù)。盤古 CV 大模型業(yè)界最大 CV 大模型、首次實現(xiàn)兼顧判別與生成能力、在 ImageNet 上小樣本學習能力上的業(yè)界第一;盤古氣象大模型提供秒級天氣預報;紫東.太初是全球首個圖、文、音三模態(tài)大模型。
對于盤古大模型定位,華為內部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡結構要強,能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場景。
華為云官網(wǎng)顯示,盤古大模型由 NLP 大模型、CV 大模型、多模態(tài)大模型、科學計算大模型等多個大模型構成,通過模型泛化,解決傳統(tǒng) AI 作坊式開發(fā)模式下不能解決的 AI 規(guī)模化、產(chǎn)業(yè)化難題,可以支持多種自然語言處理任務,包括文本生成、文本分類、問答系統(tǒng)等等。
華為表示,盤古 NLP 大模型由華為云、循環(huán)智能和鵬城實驗室聯(lián)合開發(fā),具備領先的語言理解和模型生成能力:在權威的中文語言理解評測基準 CLUE 榜單中,盤古 NLP 大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新三項榜單世界歷史紀錄;總排行榜得分 83.046,多項子任務得分業(yè)界領先,向人類水平(85.61)邁進了一大步。
具體來看,盤古 NLP 大模型首次使用 Encoder-Decoder 架構,兼顧 NLP 大模型的理解能力和生成能力,保證了模型在不同系統(tǒng)中的嵌入靈活性。下游應用中,僅需少量樣本和可學習參數(shù)即可完成千億規(guī)模大模型的快速微調和下游適配,這一模型在智能輿論以及智能營銷方面都有不錯的表現(xiàn)。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。
標簽: