“大瓦特”是什么?
專為電力系統(tǒng)設(shè)計的電力行業(yè)自主可控大模型,具備意圖識別、多輪對話、總結(jié)提煉、自動生成巡檢報告、可視化數(shù)據(jù)服務(wù)等能力。
大瓦特包括NLP(自然語言處理)大模型、CV(計算機視覺)大模型和科學(xué)計算大模型。
“大瓦特”有何特點?
大瓦特除了使用海量的世界知識進行訓(xùn)練外,還使用了大量的電力行業(yè)知識,具備電力行業(yè)的專業(yè)能力和屬性。
電網(wǎng)為什么需要大模型?
大模型能實現(xiàn)電力系統(tǒng)范圍內(nèi)的復(fù)雜應(yīng)用。大模型是一種能處理海量數(shù)據(jù),完成各種復(fù)雜任務(wù)的深度學(xué)習(xí)模型,可以更加準(zhǔn)確地識別和理解現(xiàn)實世界中的復(fù)雜信息。
近日,《南方電網(wǎng)公司“大瓦特”推廣應(yīng)用工作方案的通知》(以下簡稱《推廣應(yīng)用方案》)印發(fā),全面賦能全網(wǎng)各業(yè)務(wù)域提質(zhì)增效,打造“大瓦特”應(yīng)用生態(tài),推動公司高質(zhì)量發(fā)展。
“大瓦特”是專為電力系統(tǒng)設(shè)計的電力行業(yè)首個自主可控大模型,具備意圖識別、多輪對話、總結(jié)提煉、自動生成巡檢報告、可視化數(shù)據(jù)服務(wù)等能力。
大模型怎么做到如此智能?南網(wǎng)數(shù)字集團二級領(lǐng)軍專業(yè)技術(shù)專家趙必美解釋:“大模型內(nèi)部有數(shù)千億個參數(shù),相當(dāng)于人腦的神經(jīng)元,可以傳導(dǎo)記憶進行學(xué)習(xí),它內(nèi)部的神經(jīng)網(wǎng)絡(luò)也通過模仿人腦進行架構(gòu),所以大模型擁有和人一樣的深度學(xué)習(xí)和表達(dá)能力。”
更精準(zhǔn) 電力AI向大模型挺進
AI的工作原理決定了AI能把事情做到什么程度。過去的AI大都屬于判定式AI,我們可以把它理解成是一位按部就班的管家,只能完全按照設(shè)定的規(guī)則機械地執(zhí)行指令,處理復(fù)雜場景的能力還遠(yuǎn)遠(yuǎn)不夠。在電力系統(tǒng)中,目前大量的系統(tǒng)應(yīng)用是規(guī)則算法、對話樹、模板化開發(fā)等傳統(tǒng)方式,在面對復(fù)雜多樣的場景和用戶時,經(jīng)常出現(xiàn)算法和模型并不知道用戶的真實意圖。
這些問題只有大模型可以解決。“具有大規(guī)模參數(shù)和復(fù)雜計算機構(gòu)的大模型,通過大規(guī)模訓(xùn)練數(shù)據(jù),可以學(xué)習(xí)到豐富的知識和模式,進而能夠處理各種復(fù)雜的任務(wù),如文本生成、翻譯、問答等,是一種能處理海量數(shù)據(jù),完成各種復(fù)雜任務(wù)的深度學(xué)習(xí)模型。”趙必美說。
當(dāng)模型的訓(xùn)練數(shù)據(jù)和參數(shù)不斷擴大達(dá)到一定的臨界規(guī)模后,其表現(xiàn)出了一些未能預(yù)測的、更復(fù)雜的能力和特性,模型能夠從原始訓(xùn)練數(shù)據(jù)中自動學(xué)習(xí)并發(fā)現(xiàn)新的、更高層次的特征和模式,這種能力被稱為“涌現(xiàn)能力”。“小模型雖然有參數(shù)小、推理速度快、部署容易等優(yōu)點,但和擁有‘涌現(xiàn)能力’的大模型相比,并不足以支撐龐大的電力系統(tǒng)的規(guī)模。”南網(wǎng)數(shù)字集團平臺技術(shù)事業(yè)部經(jīng)理鄭樺說,電力生產(chǎn)場景復(fù)雜,背景變化很大,大模型在實測中,體現(xiàn)出了更好的準(zhǔn)確率和召回率。
AI大模型的發(fā)展經(jīng)歷了從單一模態(tài)的處理擴展到多模態(tài)的整合的發(fā)展。多模態(tài)大模型是指能夠同時處理和分析來自不同模態(tài)數(shù)據(jù)的技術(shù),如文本、圖像、音頻和視頻等。
“‘大瓦特’是一個多種模態(tài)大模型家族。”趙必美介紹,“大模型讓AI系統(tǒng)可以更加準(zhǔn)確地識別和理解現(xiàn)實世界中的復(fù)雜信息,實現(xiàn)不同模態(tài)數(shù)據(jù)之間的深度融合和交互,還可以拓寬應(yīng)用場景。”比如,智能客服系統(tǒng)可以通過整合語音和文字信息,實現(xiàn)更自然、高效的交互,為客戶提供更加全面和準(zhǔn)確的用電建議。又比如,在設(shè)備維護領(lǐng)域,每天產(chǎn)生的海量圖像、音頻、日志等數(shù)據(jù),大模型可以對海量數(shù)據(jù)進行分析,從中提取出重要信息,過濾無效信息。
更可靠 “大瓦特”堅持自主可控
“AI大模型的開發(fā)需要具備豐富的開發(fā)資源,以及龐大的數(shù)據(jù)、算力支撐,南方電網(wǎng)公司擁有大量數(shù)據(jù),包括TB級別文本數(shù)據(jù)集,千萬級別圖像數(shù)據(jù)庫等,具有實現(xiàn)的客觀條件。”趙必美說。
擁有客觀條件只是前提,要做到真正意義上的自主可控,才能不受制于人。“在別人的地基上建房子就難以實現(xiàn)自主可控。”鄭樺介紹,南方電網(wǎng)公司依托自有核心研發(fā)力量,從零開始構(gòu)建大模型,基于自主可控算力集群進行多機多卡訓(xùn)練,使用自有數(shù)據(jù)進行訓(xùn)練,做到源碼、數(shù)據(jù)、算力、框架的自主可控。
“有大廠認(rèn)為全人工智能大模型不可能,甚至以為我們用的就是文心一言。”南方電網(wǎng)公司高級技術(shù)專家梁壽愚說。實際上,大瓦特是一個系列,包括NLP(自然語言處理)大模型、CV(計算機視覺)大模型和科學(xué)計算大模型,而且大瓦特除了使用海量的世界知識進行訓(xùn)練外,還使用了大量的電力行業(yè)知識,所以它具備了電力行業(yè)的能力和屬性。
人工智能是數(shù)字電網(wǎng)從自動化走向智能化的必經(jīng)之路。隨著人工智能技術(shù)的迅猛發(fā)展,大模型技術(shù)不斷進化,自主可控大模型“大瓦特”對于數(shù)字電網(wǎng)的建設(shè)起到牽引作用。
更強大 推廣全場景應(yīng)用
在新一輪科技革命和產(chǎn)業(yè)變革加速發(fā)展的背景下,人工智能成為新質(zhì)生產(chǎn)力,全力搶占人工智能這個“制高點”是當(dāng)下大部分企業(yè)搶抓未來發(fā)展主動權(quán)的抓手。
7月10日,南方電網(wǎng)公司召開高質(zhì)量發(fā)展大會,要求深入開展“AI+”專項行動,強化算力、數(shù)據(jù)、模型要素供給,深化高價值業(yè)務(wù)場景牽引,推動“大瓦特”規(guī)?;瘧?yīng)用。
“研發(fā)AI的目標(biāo)是實現(xiàn)智能輔助,例如幫助員工減輕工作量,提高工作效率,有更加強大和準(zhǔn)確的數(shù)據(jù)分析、設(shè)備檢測等工具。而從長遠(yuǎn)來看是要實現(xiàn)機器代人,將員工投入到更加有價值部分去。”梁壽愚說。
“‘大瓦特’在圖像、視頻及自然語言處理能力、大模型參數(shù)規(guī)模等基礎(chǔ)能力方面仍有提升空間,可通過推廣應(yīng)用反向推進‘大瓦特’基礎(chǔ)能力的夯實。”趙必美提到,《推廣應(yīng)用方案》印發(fā)后,通過開展“大瓦特”的推廣應(yīng)用,有利于公司充分發(fā)揮需求規(guī)模大、產(chǎn)業(yè)配套全、應(yīng)用場景多的獨特戰(zhàn)略優(yōu)勢,帶頭搶抓人工智能賦能電力產(chǎn)業(yè)機遇,率先形成新質(zhì)生產(chǎn)力,助力新型電力系統(tǒng)構(gòu)建,加快推進公司高質(zhì)量發(fā)展。
南網(wǎng)報記者 黃璐 通訊員 彭雅瑩
評論