每經(jīng)記者:王晶 每經(jīng)編輯:梁梟
當前,國內(nèi)大模型進展不斷。7月7日,在華為開發(fā)者大會2023(Cloud)上,華為常務(wù)董事、華為云CEO張平安發(fā)布了盤古大模型3.0。據(jù)他介紹,盤古大模型3.0是一個面向行業(yè)的大模型系列,包括“5 N X”三層架構(gòu)。
傳統(tǒng)的AI開發(fā)模式下,一個場景對應(yīng)一個模型,數(shù)據(jù)質(zhì)量差、樣本少,模型精度差,并且應(yīng)用場景相對單一。不同行業(yè)、不同場景對AI的需求既復(fù)雜且碎片化,每個痛點都需要進行定制化地開發(fā)和改造;另一方面,AI算法從理論上能夠極大提升產(chǎn)品及服務(wù)的價值量,但由于開發(fā)過程中存在大量的碎片化因素,不同的應(yīng)用場景往往需要獨立的架構(gòu)設(shè)計與調(diào)參,效率相對較低?!靶∽鞣皇健钡腁I開發(fā)模式在一定程度上限制了生產(chǎn)力。
華為云CEO張平安 圖片來源:官方供圖
從華為盤古大模型的進化路徑可以看出,主要分為L0、L1、L2三個階段。L0指基礎(chǔ)大模型,L1是在L0基礎(chǔ)上導(dǎo)入行業(yè)數(shù)據(jù)進行訓(xùn)練后衍生出的行業(yè)大模型,L2是在L1基礎(chǔ)上結(jié)合行業(yè)細分場景得到的推理模型,上層是在下層的基礎(chǔ)上演化而來,層層遞進。國金證券認為,華為盤古大模型是一種工業(yè)化AI開發(fā)的新模式,可以解決小模型的定制化難題,使一個模型應(yīng)用到多個場景中。
具體來看,其中,L0層包括自然語言、視覺、多模態(tài)、預(yù)測、科學(xué)計算五個基礎(chǔ)大模型,包括NLP(自然語言處理)大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力。
L1層是指N個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù)、金融、制造、礦山、氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上,為客戶訓(xùn)練自己的專有大模型。L2層則提供面向各行業(yè)中更細化場景的模型,如先導(dǎo)藥物篩選、傳送帶異物檢測、臺風路徑預(yù)測等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場景等。
公開資料顯示,華為盤古大模型于2020年啟動研發(fā)。2021年4月,華為發(fā)布了NLP大模型、視覺大模型和科學(xué)計算大模型。此后,盤古大模型在性能、深度、架構(gòu)方面及數(shù)據(jù)增強方面持續(xù)升級。當前,盤古大模型的核心定位是為各行各業(yè)賦能。
會上,張平安分別介紹了盤古大模型在金融、金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等諸多行業(yè)發(fā)揮的價值。
例如,在煤礦領(lǐng)域,盤古礦山大模型已經(jīng)在全國8個礦井規(guī)模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務(wù)流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業(yè),減少安全事故;在氣象領(lǐng)域,原來預(yù)測一個臺風未來10天的路徑,需要在3000臺服務(wù)器的高性能計算機集群上花費5小時進行仿真?,F(xiàn)在基于預(yù)訓(xùn)練的盤古氣象大模型,10秒內(nèi)就可以獲得更精確的預(yù)測結(jié)果。
張平安表示,華為的盤古大模型不會寫詩,只會做事。它要幫助各行各業(yè),在各個領(lǐng)域都要讓AI來賦予它們價值。比如金融、礦山、政務(wù),有很多工作小組都派下去?!拔覀円恢眻猿值姆较蚓褪恰瓵I for Industries’”
每日經(jīng)濟新聞
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。