專題:第21屆中國(guó)國(guó)際金融論壇

徐民:遠(yuǎn)比ChatGPT之前很多年,工行就已持續(xù)跟蹤大模型技術(shù)  第1張

  第21屆中國(guó)國(guó)際金融論壇于2024年12月19日-20日在上海召開(kāi)。中國(guó)工商銀行軟件開(kāi)發(fā)中心總經(jīng)理助理徐民出席并演講。

  以下為演講實(shí)錄:

  徐民:尊敬的來(lái)賓朋友,大家好,我是工行軟件開(kāi)發(fā)中心徐明,今天也非常榮幸,第二次來(lái)參加這個(gè)主題論壇,今天和大家一起共同探討交流,今天我分享的內(nèi)容主要是工商銀行大模型的一個(gè)建設(shè)和應(yīng)用實(shí)踐。????

  人工智能現(xiàn)在可以說(shuō)是非常熱,國(guó)家也是高度重視人工智能的一個(gè)發(fā)展,要求從各個(gè)方面的一些基礎(chǔ)能力都要全方位的提升,并且這個(gè)要加快在各行各業(yè)的一個(gè)賦能應(yīng)用,也是提出了這個(gè)數(shù)字經(jīng)濟(jì)的一個(gè)創(chuàng)新發(fā)展來(lái)加快發(fā)展新質(zhì)生產(chǎn)力。應(yīng)該說(shuō)也是標(biāo)志著人工智能已經(jīng)上升為國(guó)家戰(zhàn)略,政府工作報(bào)告這個(gè)也明確提出了人工智能加這么一個(gè)口號(hào)。

  人工智能應(yīng)該說(shuō)在1956年就是由達(dá)特茅斯會(huì)議上就首次被提出來(lái),經(jīng)過(guò)這么多年的一個(gè)演進(jìn)和發(fā)展,應(yīng)該說(shuō)一直到2022年ChatGPT的出現(xiàn)應(yīng)該說(shuō)讓人工智能迎來(lái)了新的時(shí)刻,超大的規(guī)模的算力,超大規(guī)模的數(shù)據(jù),超大規(guī)模的算法和超大規(guī)模一個(gè)電力的一些投入,正在加速推進(jìn)人工智能的一個(gè)技術(shù)的一些成熟,大模型的一些技術(shù)的成熟,也在推進(jìn)通用人工智能技術(shù)的一個(gè)發(fā)展,EGI的一個(gè)時(shí)代應(yīng)該說(shuō)已經(jīng)真的到來(lái)了,大模型也成了近些年來(lái)人工智能最具有突破性的一個(gè)核心技術(shù),可以說(shuō)我們真正邁向了AI 2.0的一個(gè)智慧金融的新時(shí)代。

  工行應(yīng)該說(shuō)其實(shí)跟大模型的技術(shù)其實(shí)跟得非常早,遠(yuǎn)比ChatGPT出來(lái)之前很多年我們就持續(xù)地跟蹤這方面的一個(gè)技術(shù),在過(guò)程當(dāng)中也在一直在研究和探索,其實(shí)也做了一些很多的嘗試。隨著這兩年的一個(gè)大模型的成熟,我們把大模型作為了最重要的一個(gè)技術(shù)創(chuàng)新點(diǎn),著力地來(lái)推進(jìn)金融領(lǐng)域的一個(gè)應(yīng)用落地。以往我們的一些技術(shù)創(chuàng)新的模式一般是先孵化,取得一些成效了以后,再進(jìn)行一些規(guī)?;耐茝V和應(yīng)用。

  在大模型出來(lái)的那個(gè)時(shí)候,我們就意識(shí)到真正是未來(lái)發(fā)展的一個(gè)方向,所以我們從一開(kāi)始建設(shè)的時(shí)候,我們以規(guī)模化應(yīng)用企業(yè)級(jí)應(yīng)用為目標(biāo)來(lái)進(jìn)行建設(shè)和演進(jìn)的。我們整個(gè)的一個(gè)方式是可以說(shuō)是三個(gè)支柱,“1+N”的范式能力兩全平臺(tái)以及一個(gè)人工智能+金融生態(tài),三根支柱主要是算力、模型和數(shù)據(jù)。在這個(gè)基礎(chǔ)上構(gòu)建了“1+N”范式的能力,兩全平臺(tái)主要是一個(gè)研發(fā)能力和安全的能力,以及上層的一個(gè)全域的生態(tài)的總體的這么一個(gè)建設(shè)思路,也是建成了基建算力、算法、數(shù)據(jù)工具能力、安全應(yīng)用、生態(tài)于一體的一個(gè)企業(yè)級(jí)千億大模型的一個(gè)技術(shù)體系,內(nèi)外協(xié)同賦能來(lái)真正打造人工智能加金融的一個(gè)新生態(tài)。

  首先介紹三個(gè)基礎(chǔ)能力,第一個(gè)就是算力,這個(gè)其實(shí)是基礎(chǔ),這個(gè)也是非常重要的,而且大模型對(duì)算力的需求遠(yuǎn)比以前的人工智能的小模型要大得多,不管是從訓(xùn)練也好,還是從推理也好,工行建成了異構(gòu)融合得這么 AI的一個(gè)算力底座,也是有三個(gè)主要的一個(gè)特點(diǎn),那一個(gè)是算力的集群規(guī)模,我們現(xiàn)在可以說(shuō)是同業(yè)最大的,我們現(xiàn)在已經(jīng)達(dá)到了1.2eFLops,也是有效支撐了模型的訓(xùn)練和推理的使用。

  第二個(gè)是我們打造了云智融合的這么一個(gè)智能底座,也是云化的方式進(jìn)行算力的供給和調(diào)配,我們可以做到算力的在分鐘級(jí)進(jìn)行一個(gè)彈性的分配和調(diào)度。

  第三個(gè)是我們基礎(chǔ)底座完全是全面兼容業(yè)內(nèi)領(lǐng)先的各式各樣的一個(gè)大模型的能力,適配整個(gè)一個(gè)大模型的技術(shù)生態(tài),因?yàn)楝F(xiàn)在大模型也確實(shí)比較多百花齊放。這邊寫(xiě)的叫百模千態(tài),不管是開(kāi)源的商用的確實(shí)非常多,我們通過(guò)底座的能力也可以有效應(yīng)對(duì)大模型技術(shù)的快速的變化。

  第二個(gè)是在模型能力方面,工行采取了多種的路線并行的一個(gè)方式,來(lái)建成多模態(tài)多能力大小模型協(xié)同融合的一個(gè)千億級(jí)金融大模型的一個(gè)算法矩陣,我們已經(jīng)形成了一個(gè)矩陣。這個(gè)算法矩陣我們有特三個(gè)特點(diǎn),第一個(gè)就是我們分層模型的一個(gè)供給能力,我們整個(gè)模型這個(gè)層次分為五層,最下面的就是基礎(chǔ)大模型其實(shí)是最通用的,大部分能力其實(shí)主要是集成了業(yè)內(nèi)的一些能力。第二層是面向于金融行業(yè)的行業(yè)大模型這個(gè)方面我們做了非常多的一些工作。第三層是適配我們工行自己使用的自己業(yè)務(wù)要求的企業(yè)的大模型,最上面兩層是我們這個(gè)領(lǐng)域的大模型和各類任務(wù)的一個(gè)大模型,這個(gè)模型能力本身我們是分層來(lái)進(jìn)行打造的。

  第二個(gè)是我們整個(gè)體系的智能化的擇優(yōu)調(diào)度能力,我們整個(gè)體系會(huì)根據(jù)模型的不同層次的差異,不同模型之間的能力的差異,以及具體場(chǎng)景的業(yè)務(wù)的一些需要和需求,來(lái)實(shí)現(xiàn)一些不同參數(shù)不同能力模型的一些擇優(yōu)的選擇和調(diào)度,來(lái)滿足金融業(yè)務(wù)場(chǎng)景復(fù)雜多樣化的一個(gè)需求,這個(gè)我們是自動(dòng)調(diào)度的,這個(gè)不是靠人來(lái)選的,因?yàn)橄旅娴牡讓幽芰Ψ浅?fù)雜。

  第三個(gè)是我們經(jīng)過(guò)我們的一個(gè)打造,我們現(xiàn)在大模型,特別是在行業(yè)的認(rèn)知能力上現(xiàn)在是非常強(qiáng)的。我們舉個(gè)例子來(lái)說(shuō),我們的一些像銀行從業(yè)人員資格認(rèn)證,資產(chǎn)經(jīng)濟(jì)師的一些考試,我們內(nèi)部的各種業(yè)務(wù)人員的資格認(rèn)證,我們?nèi)纪ㄟ^(guò)了,大模型完全是通過(guò)的。

  構(gòu)建上面說(shuō)的這些模型算法的矩陣,其實(shí)保證大模型的一個(gè)訓(xùn)練質(zhì)量就成為重中之重的一個(gè)內(nèi)容,因?yàn)槲覀冊(cè)诖竽P偷墓ぷ魃掀鸩揭脖容^早,投入也比較大,所以這些方面我工作做的基礎(chǔ)工作做得比較多一些。

  這個(gè)里面其實(shí)關(guān)鍵就在于數(shù)據(jù),這個(gè)數(shù)據(jù)和我們傳統(tǒng)意義上說(shuō)的數(shù)據(jù)中臺(tái)的我們那種海量數(shù)據(jù)(維權(quán))是不同的,我們這個(gè)數(shù)據(jù)是用于訓(xùn)練大模型用的一個(gè)數(shù)據(jù),我們工行打造一套適配大模型的金融的一個(gè)支持工程,和我們大模型,剛才說(shuō)的5層體系相對(duì)應(yīng)的,我們建設(shè)了5層的一個(gè)支持知識(shí)的體系,構(gòu)建出了一個(gè)質(zhì)量?jī)?yōu)覆蓋廣的萬(wàn)億Token金融知識(shí)數(shù)據(jù)集,目前這方面的數(shù)據(jù)體量已經(jīng)達(dá)到了1.4個(gè)T。

  同時(shí)因?yàn)橹R(shí)的內(nèi)容有非常多的工作要去做,我們也是配套打造了一個(gè)基于這個(gè)規(guī)則和模型的金融知識(shí)工程的一個(gè)智能化流水線,能力也是覆蓋了我們的信息的采集清洗管理到使用的各個(gè)環(huán)節(jié),來(lái)減少我們以往支持?jǐn)?shù)據(jù)處理過(guò)程當(dāng)中這種人工審核等這些很繁雜以及復(fù)雜的處理工作,構(gòu)建了知識(shí)的這樣一種高效運(yùn)營(yíng)的一個(gè)新的模式,整個(gè)數(shù)據(jù)的一個(gè)產(chǎn)生處理的效率,我們估算了一下較傳統(tǒng)的這種我們的處理模式提升了大概10倍。

  在安全方面應(yīng)該說(shuō)大模型的確是有一些挑戰(zhàn),包括一些虛假數(shù)據(jù)科技倫理等一些風(fēng)險(xiǎn)的挑戰(zhàn)。為了保證大模型的一些安全應(yīng)用,我們也是全方位地加強(qiáng)了大模型全域的安全加固,建立了我們?nèi)斯ぶ悄苋虻囊粋€(gè)守護(hù)的安全能力。

  我們主要是建立了五道防線,來(lái)確保人工智能應(yīng)用的一個(gè)安全可控。

  首先構(gòu)建的是基礎(chǔ)設(shè)施的一個(gè)安全,然后在這個(gè)基礎(chǔ)上是積木的安全,積木的安全我們主要是通過(guò)引入網(wǎng)信辦已經(jīng)備案的一些大模型,同時(shí)我們自己構(gòu)建了1萬(wàn)多的金融安全專項(xiàng)測(cè)試集,來(lái)開(kāi)展一些大模型機(jī)模的一些測(cè)評(píng)和準(zhǔn)入。在一些數(shù)據(jù)安全上,我們前面說(shuō)的大量的這些構(gòu)建的一些數(shù)據(jù),有一些我們確實(shí)是引入的一些數(shù)據(jù),相關(guān)的一些數(shù)據(jù)也都是權(quán)威可信的。

  同時(shí),我們還構(gòu)建了20多萬(wàn)的敏感詞的詞庫(kù),對(duì)數(shù)據(jù)內(nèi)容進(jìn)行校驗(yàn)和脫敏。在實(shí)際應(yīng)用的模型安全方面,我們基于10多萬(wàn)的正向的價(jià)值觀數(shù)據(jù)來(lái)做人類反饋的強(qiáng)化學(xué)習(xí)訓(xùn)練,來(lái)提升模型的安全能力。

  最后是應(yīng)用的安全,我們也是構(gòu)建了敏感信息攔截等這一系列的能力,應(yīng)該說(shuō)通過(guò)5層的能力來(lái)全面保障大模型以及人工智能的整體的安全。

  前面介紹的這些都是一些基礎(chǔ)能力,最后關(guān)鍵還是要落實(shí)到應(yīng)用上,工行為了大規(guī)模企業(yè)級(jí)的進(jìn)行場(chǎng)景應(yīng)用,我們體系性的總結(jié)提煉,并建設(shè)了適合金融行業(yè)的“1+N”的一個(gè)企業(yè)級(jí)的工程化解決方案。

  首先介紹“1+N”“1”是指我們打造的一個(gè)金融智能中樞,也是在前面這些技術(shù)能力的基礎(chǔ)上來(lái)打造的。通過(guò)智能中樞的感知決策、執(zhí)行反饋等這些能力,可以非常好地來(lái)支撐和實(shí)現(xiàn)我們金融場(chǎng)景一些非常復(fù)雜的場(chǎng)景的應(yīng)用。

  “N”是指我們一些共享可復(fù)用的范式能力,這個(gè)范式其實(shí)不光是建設(shè)的一個(gè)方法,而是我們建設(shè)了配套的即插即用的0代碼工程化的解決能力。我們那些場(chǎng)景應(yīng)用人員在已有的范式范圍內(nèi),可以很方便地進(jìn)行場(chǎng)景的構(gòu)建,通過(guò)一些拖拉拽選擇等都不需要開(kāi)發(fā),就能完成大模型場(chǎng)景的一些構(gòu)建。

  為了確保大模型應(yīng)用地從繁到簡(jiǎn),從規(guī)模化的有序推進(jìn),我們也是通過(guò)體系運(yùn)作方法論來(lái)推動(dòng)業(yè)務(wù)和技術(shù)的雙向融合,來(lái)實(shí)現(xiàn)大模型端對(duì)端的賦能,這個(gè)里面主要是兩方面。???

  第一,我們形成了“兩屆六步”的方法論,主要是和業(yè)務(wù)融合去進(jìn)行融合創(chuàng)新賦能的。???

  第二個(gè)我們形成了一個(gè)“3-1-X”的一個(gè)方法論,來(lái)提煉上面提到的我們這種范式能力,進(jìn)而實(shí)現(xiàn)規(guī)?;念I(lǐng)域和場(chǎng)景的一個(gè)推廣。

  目前我們已經(jīng)規(guī)?;茝V的業(yè)務(wù)領(lǐng)域就有20多個(gè),170多個(gè)應(yīng)用場(chǎng)景,有一些小范圍的嘗試的,比如說(shuō)像一些分行一個(gè)分行,他自己嘗試的這種場(chǎng)景,都已經(jīng)達(dá)到幾十個(gè),都是通過(guò)我們這樣能力快速地可以構(gòu)建完成。特別是有很多一些比較基層的業(yè)務(wù)人員都可以完成一些構(gòu)建,完全不需要技術(shù)力量的一個(gè)開(kāi)發(fā)這么一個(gè)情況。

  另外其實(shí)數(shù)字化的工作,我相信大家其實(shí)做得也比較多,工行其實(shí)也做了非常多年的一些建設(shè),經(jīng)過(guò)這些年的不斷的數(shù)字化的能力建設(shè),包括大數(shù)據(jù)的能力,包括數(shù)字化運(yùn)營(yíng),包括人工智能的一些能力,應(yīng)該說(shuō)我們綜合應(yīng)用這種大數(shù)據(jù)人工智能的一些技術(shù)手段,已經(jīng)積累了大量的高價(jià)值的這種數(shù)據(jù)服務(wù),智能模型服務(wù)系統(tǒng)功能,包括像一些營(yíng)銷推薦、影像識(shí)別、風(fēng)控等這些以往的能力。

  目前我們通過(guò)我們金融智能中樞能力的這么一個(gè)打造,真正實(shí)現(xiàn)了可以采取這種積木組裝的一個(gè)方式,快速地構(gòu)建智能體,將原來(lái)我們已經(jīng)完成研發(fā)構(gòu)建的各類的大模型小模型、數(shù)據(jù)服務(wù)、智能模型服務(wù)、數(shù)據(jù)產(chǎn)品系統(tǒng)功能完全都可以串接起來(lái),并且進(jìn)行靈活調(diào)度,規(guī)?;蛟炝烁黝惖臉I(yè)務(wù)助手串接,這些工作我前面就說(shuō)就完全可以通過(guò)業(yè)務(wù)自己來(lái)完成。

  下面我再介紹兩個(gè)工行前期的大模型的一些應(yīng)用。

  第一個(gè)是遠(yuǎn)程銀行領(lǐng)域,聚焦對(duì)客服務(wù)非常重要,然后我們?nèi)藬?shù)也非常多的遠(yuǎn)程客服的一個(gè)座席,我們基于大模型的一個(gè)能力,從事前事中事后全流程的來(lái)賦能業(yè)務(wù)的一個(gè)場(chǎng)景,來(lái)打造更高效更有溫度的一個(gè)服務(wù)能力。當(dāng)前已經(jīng)覆蓋了全行所有的遠(yuǎn)程客服,實(shí)現(xiàn)了全面的一個(gè)賦能,事前可以輔助進(jìn)行一些知識(shí)庫(kù)的維護(hù)這些工作。

  材料當(dāng)中的這塊其實(shí)是效果比較明顯的,主要是適中的方面,客戶電話打到我們9588,以后我們大模型實(shí)時(shí)的同步的根據(jù)通話客戶反映的通話的內(nèi)容,實(shí)時(shí)的就可以給我們座席人員給出針對(duì)客戶問(wèn)題的解答,客服就可以快速地答復(fù)客戶的問(wèn)題。

  目前我們大模型回答的準(zhǔn)確率已經(jīng)超過(guò)97%,對(duì)于需要事后處理的問(wèn)題,大模型我可以快速地形成這種工單進(jìn)行各個(gè)環(huán)節(jié)的一個(gè)流轉(zhuǎn)。通過(guò)這樣的方式,可以說(shuō)大幅提升了我們座席人員的服務(wù)能力,服務(wù)水平、標(biāo)準(zhǔn)化水平以及服務(wù)效率,同時(shí)也提升了我們客戶的滿意度。事后同時(shí)還可以通過(guò)一些大模型來(lái)對(duì)客服的服務(wù)情況進(jìn)行一些精細(xì)化的質(zhì)檢。

  第二個(gè)介紹的是我們金融市場(chǎng)領(lǐng)域,我們也是通過(guò)智能體來(lái)重塑了業(yè)務(wù)模式,圍繞投資研判、交易執(zhí)行程序、管理、風(fēng)險(xiǎn)監(jiān)測(cè),端對(duì)端的流程來(lái)依托大模型,打造了我們的投研的助手,交易的助手,業(yè)務(wù)的管理助手。通過(guò)對(duì)話的方式,為金融市場(chǎng)各個(gè)角色的用戶提供了全方位的一個(gè)智能服務(wù),對(duì)客戶交易的效率顯著提升。

  其中材料當(dāng)中提到的也是當(dāng)中這塊就交易助手這一塊,我們打造了一個(gè)明星產(chǎn)品,在交易過(guò)程當(dāng)中可以對(duì)客戶進(jìn)行快速的資質(zhì)審查,包括洗錢風(fēng)險(xiǎn)企業(yè)規(guī)模信用評(píng)級(jí),以往已經(jīng)建設(shè)的這些能力,進(jìn)而自動(dòng)生成交易的單子來(lái)自動(dòng)流轉(zhuǎn),各個(gè)環(huán)節(jié)來(lái)做審核交易報(bào)價(jià)等,完全智能化自動(dòng)化的來(lái)做到這些事情,實(shí)現(xiàn)結(jié)售匯、外匯等這種詢價(jià)交易,對(duì)客交易的效率的大幅提升超過(guò)三倍。

  前面說(shuō)了這么多,大家也可以看到整個(gè)大模型的一些建設(shè),應(yīng)該說(shuō)還是如果要產(chǎn)生規(guī)模化效益的話,其實(shí)整個(gè)投入量還是非常大的,其實(shí)牽涉的內(nèi)容也非常多,所以其實(shí)我們也非常希望和大家一道攜起手來(lái)共同建設(shè),工商銀行也積極推進(jìn)金融大模型生態(tài)圈的一個(gè)建設(shè),一個(gè)是打造走出去和請(qǐng)進(jìn)來(lái)雙人驅(qū)動(dòng)的這么一個(gè)人工智能加金融創(chuàng)新的生態(tài)圈,幫助金融同業(yè)企業(yè)朋友培育和發(fā)展大模型的新質(zhì)生產(chǎn)力,我們很歡迎大家如果有需要也可以用我們那個(gè)能力我完全不排斥。

  第二個(gè)是積極地以工行大模型的應(yīng)用實(shí)踐為基礎(chǔ),充分發(fā)揮工商銀行金融的一個(gè)數(shù)據(jù),算力、場(chǎng)景等這些方面的一個(gè)優(yōu)勢(shì),來(lái)推動(dòng)金融行業(yè)的共享共建,來(lái)提升大模型整體的一個(gè)應(yīng)用水平,帶動(dòng)金融AI產(chǎn)業(yè)生態(tài)的一個(gè)發(fā)展。

  最后我想對(duì)未來(lái)的一些發(fā)展,我覺(jué)得大模型在金融方面金融行業(yè)的一些應(yīng)用,我想還是有一些內(nèi)容去演進(jìn)的。

  首先我覺(jué)得還是算力,雖然前面說(shuō)了這么多,但是在算力確實(shí)是大模型的一個(gè)基礎(chǔ),我們需要繼續(xù)加大算力供給的一個(gè)投入,或者說(shuō)更多的這種使用和合作的這種方式,為大模型在金融行業(yè)的廣泛應(yīng)用奠定良好的一個(gè)基礎(chǔ)。

  第二個(gè)其實(shí)是一個(gè)模型基礎(chǔ),這里寫(xiě)的金融知識(shí)數(shù)據(jù)積累其實(shí)是模型基礎(chǔ)能力,這里金融基礎(chǔ)數(shù)據(jù)的一個(gè)數(shù)量和質(zhì)量,其實(shí)是決定了金融行業(yè)建設(shè)大模型一個(gè)能力,性能、準(zhǔn)確性等這些方面很基礎(chǔ)的一個(gè)關(guān)鍵,這里我們需要更好地去收集金融知識(shí)的一個(gè)數(shù)據(jù),構(gòu)建高質(zhì)量金融訓(xùn)練數(shù)據(jù)集,為行業(yè)大模型構(gòu)建提供良好的一個(gè)數(shù)據(jù)支撐。當(dāng)然這個(gè)基礎(chǔ)能力上面還有一些多模態(tài)等這些能力的一些演進(jìn)。

  還有一方面大模型,我覺(jué)得在金融領(lǐng)域的一個(gè)深度應(yīng)用,目前大家更多的還是側(cè)重于實(shí)現(xiàn)一些智能助手等這些業(yè)務(wù)輔助的功能,還是更多是一些文科生的領(lǐng)域,未來(lái)我覺(jué)得隨著大模型技術(shù)更進(jìn)一步的發(fā)展和成熟,我們需要推動(dòng)大模型在金融行業(yè)的一個(gè)深度應(yīng)用,特別是實(shí)現(xiàn)從模型輔助像智能的決策的一個(gè)變革,這個(gè)里面我覺(jué)得還是要做一些工作,為整個(gè)金融行業(yè)帶來(lái)更大的一個(gè)商業(yè)價(jià)值。

  我相信大模型為基礎(chǔ)的人工智能2.0的能力一定可以有效重塑業(yè)務(wù)的行為,推動(dòng)金融行業(yè)更高質(zhì)量的一個(gè)發(fā)展。上下面這些內(nèi)容都是我們的一些思考和實(shí)踐可能還不太成熟,歡迎大家批評(píng)指正,謝謝大家。

  新浪聲明:所有會(huì)議實(shí)錄均為現(xiàn)場(chǎng)速記整理,未經(jīng)演講者審閱,新浪網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。