在發(fā)布大模型這件事兒上,華為的“畫風(fēng)”顯得不太一樣。
對C端消費(fèi)者而言,往往期待在科技巨頭們的大模型發(fā)布會上看到直觀的演示——或是流暢解答各種問題,或是數(shù)秒生成多種風(fēng)格文案,或是輕松求解數(shù)學(xué)難題,如果再能夠春花秋月地賦詩作詞一首,贏得滿場掌聲和喝彩也并非難事。
然而,如果對華為盤古大模型抱有類似的期待,難免會“失望而歸”。
就在今天(7月7日),盤古大模型 3.0于華為云開發(fā)者大會上重磅亮相。在這場發(fā)布會上,與會者反復(fù)聽到的關(guān)鍵詞是“行業(yè)”、“行業(yè)”、還是“行業(yè)”。
正如華為常務(wù)董事&華為云CEO張平安在開場演講時所說:“ 自O(shè)penAI 發(fā)布ChatGPT之后,全球掀起了一股大模型研發(fā)熱潮。據(jù)不完全統(tǒng)計(jì),全球有名有姓的大模型已經(jīng)多達(dá)數(shù)百個,僅中國上半年就發(fā)布了80多個AI大模型。這些大模型都有非常好的對話能力,非常好的文案生成能力,甚至還會寫詩作畫。那么很多人就問華為——既然華為2021年就有大模型了,為什么今年上半年幾乎聽不到一丁點(diǎn)消息呢?”
“我想告訴大家的是,華為盤古大模型不會寫詩,只會做事!盤古大模型是要扎根行業(yè),為各個行業(yè)帶來價值!我們一直堅(jiān)持的方向就是 AI for Industry,所以盤古大模型不會作詩,他也沒有時間作詩,因?yàn)樗钊氲礁餍懈鳂I(yè)里頭去!因?yàn)樗?AI 來賦予千行百業(yè)價值!”

盤古大模型,為行業(yè)而生!
在發(fā)布會現(xiàn)場,我們依然也能看到精彩的實(shí)機(jī)演示,不過這些也都是關(guān)于千行百業(yè)的落地應(yīng)用!
盤古大模型,為行業(yè)而生
沒有多余廢話,張平安開門見山地在“AI重塑千行百業(yè)”的主題演講中,一口氣介紹了盤古大模型在礦山、鐵路、氣象、金融、制造等多個行業(yè)的應(yīng)用。
盤古for礦山
我國是一個煤礦高產(chǎn)國,擁有大概 4400 處煤礦,每年產(chǎn)煤 45.6 億噸煤,但我國煤礦的數(shù)字化、智能化程度較低。為了產(chǎn)出 45.6 億噸的煤,需要280萬的煤礦工人,他們幾乎可以說是中國工人里工作最艱苦的群體之一。而盤古大模型就是要助力煤礦行業(yè)的智能化,讓更多煤礦工人能夠在地面辦公室進(jìn)行煤礦的采煤作業(yè)。

發(fā)布會現(xiàn)場的大屏上展示了一個煤礦的綜采面,一臺40多米長的采煤機(jī)正在井下持續(xù)作業(yè)。以前也有一些技術(shù)手段,比如通過監(jiān)控?cái)z像頭來監(jiān)控井下的作業(yè)狀況,但由于現(xiàn)場大量的粉塵影響了畫面的清晰度,最終還是需要煤礦工人親自下井進(jìn)行及時巡檢。
如今,盤古大模型能夠?qū)?00多路視頻集中在一起,形成如下圖所示的巨幅畫面,由于采用了投塵的算法,使得即使在塵土遮擋下也能清晰看到畫面。

由此,管理人員可以非常容易地識別出采掘過程中大塊的巖石造成的卡堵問題,使得地面工作人員不用下井就能看的全、看得清、看得準(zhǔn),從而在地面進(jìn)行煤機(jī)的操控作業(yè)。
基于盤古礦山大模型,云鼎科技和華為達(dá)成深度合作,開發(fā)了 21 個場景化應(yīng)用,覆蓋了7 大業(yè)務(wù)系統(tǒng)。目前,盤古礦山大模型已經(jīng)在全國 8 個礦井里規(guī)模使用,覆蓋了煤礦的綜采、掘進(jìn)、機(jī)電、運(yùn)輸、通風(fēng)、洗選等流程下的 1000 多個細(xì)分場景,目標(biāo)是讓更多的煤礦工人在地面上作業(yè),不僅使其工作環(huán)境更加舒適,而且可以極大減少安全事故。
盤古for鐵路
礦山說完,再來看看鐵路行業(yè)。中國總共擁有超過 100 萬輛貨車,每年跑在鐵路上的運(yùn)輸貨物量高達(dá)近五十億噸,怎么保障這些貨車的安全運(yùn)行?這也是盤古大模型大顯身手的地方,它要跑到鐵路上來服務(wù)于貨車的安全運(yùn)行。

在傳統(tǒng)的貨運(yùn)鐵路巡檢中,TFDS(貨車運(yùn)行故障動態(tài)圖像檢測)系統(tǒng)作為5T檢測技術(shù)的重要組成部分,通過高速拍攝的“電子眼”,動態(tài)采集列車車底配件、車體側(cè)部等部位圖像,以判別貨運(yùn)列車是否存在故障。而這些圖像照片會被送到檢測員前面,需要檢測員在屏幕上一張一張地看。
以平均每天過站1000輛的一個樞紐站為例,系統(tǒng)將采集400萬張圖像,需要260個有經(jīng)驗(yàn)的檢測員采用四班倒的工作節(jié)奏,一屏一屏的看,防止漏掉任何故障圖像,每一屏至少要看 8 秒,因此這些檢測員的工作強(qiáng)度極大,責(zé)任也很重。
而在部署了盤古大模型之后,一雙盤古眼就能看完所有的圖片,然后再將有潛在故障的圖片送到檢測員手里,使得需要列車檢測員看的圖片從 400 萬張銳減到20萬張,極大降低了檢測員的工作量,提升了其工作效率。
如今,盤古鐵路大模型可以對跑在鐵路上的 67 種貨車的 430 多種故障進(jìn)行檢測,故障檢測漏檢率為0,檢測效率提升了 20 倍。
盤古for氣象
在氣象領(lǐng)域,全球每年大約會生成 80 個臺風(fēng),平均有 7 個臺風(fēng)會經(jīng)過我國或登陸我國,這將對沿海城市造成極大的影響。所以盤古氣象大模型就是要提前精準(zhǔn)地預(yù)測臺風(fēng)路徑,從而助力更好的防災(zāi)減災(zāi)。
如果我們想用傳統(tǒng)方法來預(yù)測一個10 天的臺風(fēng)的路徑,需要3000臺高性能服務(wù)器花費(fèi)4-5個小時來完成相應(yīng)的計(jì)算。現(xiàn)在基于預(yù)訓(xùn)練的盤古大模型,通過 AI 推理的方式,只需要在單臺服務(wù)器上 10 秒內(nèi)就可以給出更精確的預(yù)測。
據(jù)悉,基于近40年的全球氣象數(shù)據(jù),華為云盤古氣象大模型在中長期確定性預(yù)報(bào)上超越當(dāng)前最強(qiáng)的數(shù)值預(yù)報(bào)方法(歐洲氣象中心的IFS系統(tǒng)),是業(yè)內(nèi)首個精度超過傳統(tǒng)數(shù)值預(yù)報(bào)方法的全球AI氣象預(yù)測模型。平均預(yù)報(bào)誤差降低了10%-15%,速度提升10000倍以上,實(shí)現(xiàn)秒級全球氣象預(yù)報(bào)。
今年5月,臺風(fēng)“瑪娃”走向受到廣泛關(guān)注。中央氣象臺表示,華為云盤古大模型在“瑪娃”的路徑預(yù)報(bào)中表現(xiàn)優(yōu)異,提前五天預(yù)報(bào)出其將在臺灣島東部海域轉(zhuǎn)向路徑。
這種實(shí)力也得到了科技界的認(rèn)可。就在昨日(7月6日),國際頂級學(xué)術(shù)期刊《自然》(Nature)雜志正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊(duì)研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報(bào)》(《Accurate medium-range global weather forecasting with 3D neural networks》)。這是近年來中國科技公司首篇作為唯一署名單位發(fā)表的《自然》正刊論文。

華為云盤古氣象大模型研究成果在《Nature》正刊發(fā)表
《自然》審稿人對該成果給予高度評價:“華為云盤古氣象大模型讓人們重新審視氣象預(yù)報(bào)模型的未來,模型的開放將推動該領(lǐng)域的發(fā)展?!?/p>
盤古for制造
再來看看制造業(yè),眾所周知,制造業(yè)的產(chǎn)線效率極為關(guān)鍵,盤古大模型也走進(jìn)了華為的制造生產(chǎn)線,為其產(chǎn)線制定最優(yōu)的排產(chǎn)計(jì)劃。
據(jù)張平安介紹,在沒有大模型之前,依靠個人經(jīng)驗(yàn),華為的單產(chǎn)線器件分配計(jì)劃往往需要花3小時才能做齊。如今,盤古全局統(tǒng)籌的最優(yōu)規(guī)劃,使得1分鐘就可以做出未來三天的生產(chǎn)計(jì)劃。
值得一提的是,在后續(xù)的演講環(huán)節(jié),華為云EI服務(wù)產(chǎn)品部部長尤鵬還為大家?guī)砹肆钊擞∠笊羁痰默F(xiàn)場演示。
在傳統(tǒng)制造行業(yè)中,不管是生產(chǎn)、供應(yīng)還是交付,都存在大量的決策優(yōu)化問題,比如說生產(chǎn)的排程、運(yùn)力的規(guī)劃等等,其實(shí)傳統(tǒng)的求解過程是非常復(fù)雜的,需要非常多的業(yè)務(wù)專家、數(shù)學(xué)專家、編程專家來把一個運(yùn)籌優(yōu)化的問題變成一個求解問題。
而在現(xiàn)場演示中,尤鵬展示了一個器件分配的場景——假設(shè)計(jì)劃員收到了一個器件分配的需求,如下圖所示,其關(guān)鍵在于把兩種核心器件分配到三個逆變器的生產(chǎn)計(jì)劃當(dāng)中,尋求最優(yōu)化的成本控制。

只需將這段自然語言拷貝到盤古制造大模型里,大模型能夠立即識別出這是一個建模需求,然后將其轉(zhuǎn)換一個標(biāo)準(zhǔn)的數(shù)學(xué)建模語言。

當(dāng)計(jì)劃員確認(rèn)完這個數(shù)學(xué)建模是準(zhǔn)確的之后,就可以直接調(diào)用天籌 AI 求解器來求解。通過盤古大模型和天籌 AI 求解器的結(jié)合,可以大幅降低求解的門檻,讓決策優(yōu)化快速找到最優(yōu)的解答。

盤古for政務(wù)
另一個讓筆者印象深刻的現(xiàn)場演示在于盤古大模型在政務(wù)領(lǐng)域的應(yīng)用。

華為盤古大模型政務(wù)場景應(yīng)用演示 - 西瓜視頻 (ixigua.com)
據(jù)尤鵬介紹,盤古政務(wù)大模型能夠準(zhǔn)確地理解民眾的咨詢意圖,改變傳統(tǒng)一網(wǎng)通辦的模式,把老百姓的話語轉(zhuǎn)化為政府辦事的語言,讓城市更加有溫度,更加有愛。
就在發(fā)布會當(dāng)天,華為聯(lián)合深圳市福田區(qū)政務(wù)局上線了基于盤古政務(wù)大模型的福田政務(wù)智慧助手小福。
假設(shè)你是一個來福田投資的企業(yè)負(fù)責(zé)人,可以直接向小福詢問:福田區(qū)有哪些招商政策?對新落戶的企業(yè)有哪些優(yōu)惠?政策對象有哪些群體?
小福的回答如下所示,其回答了福田區(qū)正在推行的產(chǎn)業(yè)發(fā)展政策,解答了對新落戶企業(yè)的具體優(yōu)惠措施,最后還說到了招商引資對象涵蓋的機(jī)構(gòu)和個人。
除了一網(wǎng)通辦,城市治理是另一個典型場景?;谡?wù)大模型已有的 100 多種視覺場景,盤古政務(wù)大模型可以實(shí)現(xiàn)對城市各類事件的秒級發(fā)現(xiàn)。
如下圖所示,這里有一張圖片,我們可以向盤古詢問:假設(shè)現(xiàn)在是上午8點(diǎn),根據(jù)深圳市的交通規(guī)定,畫面中是否有禁止通訊的交通工具?

盤古大模型很快識別出了違規(guī)的大型貨車,并提供了交通規(guī)則的判斷依據(jù)——也就是在每天7-24 時這個時間段內(nèi),大型貨車是有違規(guī)嫌疑的。
多模態(tài)大模型對話的能力能夠像人一樣,除了識別圖片中的物體之外,還可以結(jié)合的語義進(jìn)行理解,實(shí)現(xiàn)全場景的識別。
除了以上場景,張平安和尤鵬還在演講中闡述了盤古大模型在金融、軟件開發(fā)、數(shù)字內(nèi)容生產(chǎn)等領(lǐng)域的應(yīng)用。更進(jìn)一步,盤古大模型+具身智能,還能讓機(jī)器人具備自然語義理解和全域感知引導(dǎo)的自主智能。
總而言之,華為希望盤古大模型希望讓每個人,每個企業(yè),每個行業(yè)都擁有自己的專家助手,讓工作更高效、更輕松。

盤古大模型的三層架構(gòu)
在秀完行業(yè)肌肉之后,張平安宣布華為云盤古大模型3. 0正式發(fā)布。盤古就是要重塑千行百業(yè),盤古大模型3. 0就是一個完全面向行業(yè)的大模型系列!
具體而言,該大模型系列包含三層架構(gòu):

第一層L0層是盤古的5個基礎(chǔ)大模型,包括盤古自然語言大模型、盤古多模態(tài)大模型、盤古視覺大模型、盤古預(yù)測大模型、盤古科學(xué)計(jì)算大模型,它們提供滿足行業(yè)場景的多種技能。
盤古3.0為客戶提供100億參數(shù)、380億參數(shù)、710億參數(shù)和1000億參數(shù)的系列化基礎(chǔ)大模型,匹配客戶不同場景、不同時延、不同響應(yīng)速度的行業(yè)多樣化需求。同時提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業(yè)直接調(diào)用。無論多大參數(shù)規(guī)模的大模型,盤古提供一致的能力集。

第二層L1層是N個行業(yè)大模型,既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù)、金融、制造、礦山、氣象等;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古的L0和L1上,為客戶訓(xùn)練自己的專有大模型。
第三層L2層是為客戶提供更多細(xì)化場景的模型,它更加專注于某個具體的應(yīng)用場景或特定業(yè)務(wù),為客戶提供開箱即用的模型服務(wù)。
盤古大模型采用完全的分層解耦設(shè)計(jì),可以快速適配、快速滿足行業(yè)的多變需求??蛻艏瓤梢詾樽约旱拇竽P图虞d獨(dú)立的數(shù)據(jù)集,也可以單獨(dú)升級基礎(chǔ)模型,也可以單獨(dú)升級能力集。
在L0和L1大模型的基礎(chǔ)上,華為云還為客戶提供了大模型行業(yè)開發(fā)套件,通過對客戶自有數(shù)據(jù)的二次訓(xùn)練,客戶就可以擁有自己的專屬行業(yè)大模型。同時,根據(jù)客戶不同的數(shù)據(jù)安全與合規(guī)訴求,盤古大模型還提供了公用云、大模型云專區(qū)、混合云多樣化的部署形態(tài)。
據(jù)介紹,盤古可以一己之力做到網(wǎng)絡(luò)搜索、請教專家、參考案例、查閱書籍等,讓每個開發(fā)者都擁有一個自己的編程助手,甚至還可以實(shí)現(xiàn)一句對話代碼生成、一個按鍵用例測試、一次點(diǎn)擊自動注釋、一條指令智能部署,極大地簡化了開發(fā)的流程。
我們知道,AI能夠創(chuàng)造的價值絢麗而美好,但對開發(fā)者而言,方案落地產(chǎn)業(yè)的過程卻絕非一個“苦”字可以形容。
在過去分散化的模型研發(fā)模式下,單一的AI應(yīng)用場景下的多個任務(wù)都需要由多個模型支撐完成,每一個模型建設(shè)都需要算法開發(fā)、數(shù)據(jù)處理、模型訓(xùn)練與調(diào)優(yōu)過程。
這種傳統(tǒng)的AI開發(fā)模式就如同“小作坊”——試想一下,如果每家企業(yè)在進(jìn)行研發(fā)時,都需要自己從頭造輪子,那整個社會的工業(yè)化從何說起?從工業(yè)體系的邏輯上看,解決這一問題的核心就是提升AI開發(fā)前置工作的標(biāo)準(zhǔn)化程度,將不同開發(fā)者所需模型的公約部分提前訓(xùn)練好,即工業(yè)化中的零件化、標(biāo)準(zhǔn)化和流程化。
在探索AI工業(yè)化的過程中,預(yù)訓(xùn)練大模型逐漸成為了行業(yè)認(rèn)可的方案。其邏輯是提前將知識、數(shù)據(jù)、訓(xùn)練成果沉淀到一個模型中,然后將這個基礎(chǔ)釋放到產(chǎn)業(yè),再由不同行業(yè)、不同企業(yè)的開發(fā)者在此基礎(chǔ)上進(jìn)行二次開發(fā)和微調(diào)。
華為云盤古大模型的三層架構(gòu),正是為“預(yù)訓(xùn)練+下游微調(diào)”的開發(fā)模式提供了支撐。預(yù)訓(xùn)練大模型增強(qiáng)了人工智能的通用性、泛化性,隨后大模型負(fù)責(zé)向小模型輸出模型能力,小模型更精確地處理自己“擅長”的任務(wù),基于大模型通過零樣本或小樣本精調(diào),就可實(shí)現(xiàn)在多種任務(wù)上的較好效果。
大模型“預(yù)訓(xùn)練+下游微調(diào)”的模式帶來了新的標(biāo)準(zhǔn)化AI研發(fā)范式,開發(fā)者無需針對每一個場景重復(fù)開發(fā)AI模型,實(shí)現(xiàn)AI模型在更統(tǒng)一、簡單的方式下規(guī)?;a(chǎn)。
這是從“作坊模式”向“工廠模式”的進(jìn)化,是AI產(chǎn)業(yè)的“工業(yè)革命”!
盤古大模型是怎樣煉成的?
在了解了盤古大模型在千行百業(yè)的能力之后,你是否會好奇——盤古大模型是如何從通用大模型練成行業(yè)大模型的?
據(jù)華為云人工智能領(lǐng)域首席科學(xué)家田奇介紹,當(dāng)前通用的大模型落地行業(yè)存在三大挑戰(zhàn):
第一個挑戰(zhàn),大模型通用性強(qiáng),但專業(yè)性弱。落地行業(yè)需要具備專業(yè)知識,明白行業(yè)的工作流程,給出專業(yè)準(zhǔn)確的回答。
第二個挑戰(zhàn),大模型知識居多,但技能不足。目前通用大模型多為通用語言大模型,而企業(yè)場景復(fù)雜,需要模型能說、會看、能想、會算。
第三個挑戰(zhàn),數(shù)據(jù)是企業(yè)的核心資產(chǎn)之一,大模型可以有效地存儲和挖掘知識,但訓(xùn)練和使用大模型需要保證企業(yè)數(shù)據(jù)的安全合規(guī)。
為了應(yīng)對這些挑戰(zhàn),如上文所述,華為把盤古大模型的結(jié)構(gòu)分為三層。
其中,L0基礎(chǔ)大模型已經(jīng)存儲了大量知識,但如何將這些知識靈活地加以運(yùn)用,以解決實(shí)際問題,就需要名師加以引導(dǎo)。
在L0功能的構(gòu)建階段,華為通過有監(jiān)督、精調(diào)技術(shù)和強(qiáng)化學(xué)習(xí)來對模型進(jìn)行引導(dǎo),讓模型在其收集的5000多萬條高質(zhì)量題庫上進(jìn)行大量的練習(xí),掌握了上百種的能力。
讀了萬卷書,也有了名師指導(dǎo),接下來就要進(jìn)入行萬里路的階段。行萬里路就是將模型應(yīng)用到具體的行業(yè)中,學(xué)習(xí)各種專業(yè)知識,在行業(yè)工作流程中進(jìn)行大量的錘煉,從而得到各個行業(yè)大模型。這一階段,華為將與合作伙伴共建,沉淀行業(yè)know-how,解決企業(yè)實(shí)際的生產(chǎn)問題。
在盤古大模型 的L0功能層,華為做了上百種能力,比如語言模型的事實(shí)問答、文案生成等能力;視覺模型的檢測、分割、三維重建等能力;多模態(tài)模型的文生圖能力;科學(xué)計(jì)算的偏微分、基于方程求解、分子屬性預(yù)測等能力;以及模型編排和插件調(diào)用等高階能力。
華為深耕行業(yè),讓盤古大模型從知到行,有四大關(guān)鍵舉措。
第一個關(guān)鍵舉措是沉淀行業(yè)知識。盤古學(xué)習(xí)了十多個行業(yè)的公開數(shù)據(jù),涵蓋金融、政務(wù)、氣象、醫(yī)療健康、互聯(lián)網(wǎng)、教育、汽車、零售等。更為重要的是,華為有30多年行業(yè)經(jīng)驗(yàn)的積累。近年來,其也成立了10多個軍團(tuán)深耕行業(yè),深入了解了400多個業(yè)務(wù)場景,幫助大模型具備行業(yè)知識,熟悉行業(yè)機(jī)理。
第二個關(guān)鍵舉措是淬煉行業(yè)技能。即結(jié)合專家和行業(yè)數(shù)字環(huán)境的反饋進(jìn)行強(qiáng)化學(xué)習(xí),以達(dá)到符合行業(yè)應(yīng)用的最佳結(jié)果。
第三個關(guān)鍵舉措是對話專業(yè)工具。除了人與機(jī)器的對話,在行業(yè)應(yīng)用中,和華為更多地解決的是機(jī)器與工具的對話,以此將大模型與業(yè)務(wù)系統(tǒng)進(jìn)行融合,產(chǎn)生對話與交流,讓大模型能夠調(diào)用大量的行業(yè)資產(chǎn)和工具
第四個關(guān)鍵舉措是保證安全合規(guī)。盤古提供公有云、混合云、大模型專區(qū)這三種模式,保證安全的部署,同時建立長效機(jī)制,確保大模型安全。合規(guī)包括數(shù)據(jù)集來源和使用合規(guī)數(shù)據(jù),全生命周期安全構(gòu)建完整的數(shù)據(jù)標(biāo)注以及審核機(jī)制,構(gòu)建模型合規(guī)使用的政策,確保大模型的使用邊界。
寫在最后
任何一門技術(shù)突破都需要以產(chǎn)業(yè)賦能為技術(shù)指引,對于大模型而言,如果在消費(fèi)場景處在追趕國外的境況,不妨直接從產(chǎn)業(yè)側(cè)出發(fā),依托中國本身具備的龐大業(yè)態(tài)尋求突圍機(jī)會。
在華為看來,人工智能要面向千行百業(yè)走深向?qū)?,?chuàng)造更大的價值。當(dāng)前,AI for Industry,使能行業(yè),以及AI for Science,助力科研是關(guān)鍵方向。
古有盤古開天地,今有盤古縱四海。當(dāng)其他大模型還在吟詩作畫、講段子、抖機(jī)靈的時候,盤古大模型下礦井、上鐵路、深入網(wǎng)點(diǎn)、走進(jìn)車間,賦能千行百業(yè)的創(chuàng)新,這就是華為云一直以來所秉持的核心價值理念。
華為云堅(jiān)定的表示——未來我們也將一如既往的秉持這個理念,用盤古大模型賦能千行百業(yè)。