掃一掃
下載數(shù)字化報(bào)APP
證券日報(bào)編寫 潘玉蓉
摩根斯坦利已用GPT-4來投資策略分析,高盛公司會用大中型語言模型做風(fēng)險(xiǎn)管控剖析……
在ChatGPT變成華爾街投行的裝備時(shí),迅速、更準(zhǔn)、更定做的金融大實(shí)體模型來啦——彭博新聞社公布對于金融行業(yè)500億主要參數(shù)大語言模型BloombergGPT,在對待金融學(xué)專業(yè)每日任務(wù)中的表現(xiàn),比通用性大模型完成了大幅度提高。
近年來,大模型風(fēng)靡金融行業(yè),一夜之間,絕大多數(shù)金融場景都在探索兼容大模型插口。但是,理想豐滿,現(xiàn)實(shí)骨感。有大型金融機(jī)構(gòu)IT單位人員形容,金融大實(shí)體模型從戰(zhàn)略布局到布署落地式,擁有從“賣家秀”來到“淘寶買家秀”的差異。大模型在金融場景落地的最后一公里不怎么好走,如今談實(shí)際效果并非如此。
接受證券日報(bào)編寫采訪的時(shí)候,各種參與方均特別提到“綠色生態(tài)共創(chuàng)”,希望協(xié)同多方力量處理算率、優(yōu)化算法、數(shù)據(jù)信息、安全性、監(jiān)管等難題,同赴這一場金融大模型“開卷考”。
大模型風(fēng)靡金融行業(yè)
伴隨著大模型邁向千行百業(yè),一個(gè)的共識逐步形成:將通用性大模型與垂直領(lǐng)域的專用型大模型緊密結(jié)合,可以有效提升大模型的匹配性。繼ChatGPT后,人工智能技術(shù)將于垂直應(yīng)用行業(yè)刮起第二波的浪潮。
驚濤駭浪襲來,中國金融機(jī)構(gòu)和大模型廠商們同樣在分秒必爭風(fēng)起云涌。
在今年的8月份金融企業(yè)公布中報(bào),大語言模型只停留在高管們的口頭報(bào)告中。現(xiàn)如今,它們已經(jīng)化身為一張張采購單看向銷售市場。金融機(jī)構(gòu)采購要求,從算率貯備到實(shí)體模型購置,從云計(jì)算資源到大數(shù)據(jù)應(yīng)用,覆蓋人工智能技術(shù)產(chǎn)業(yè)鏈上的各種生產(chǎn)商。
10月10日,工行公布“NLP大模型商品新技術(shù)應(yīng)用招標(biāo)”入選結(jié)論,智譜華章入選;同年同月,招行千億級預(yù)訓(xùn)練基本大語言模型招標(biāo)中,上海市稀宇高新科技奪標(biāo);11月10日,百度搜索通知、中國電子系統(tǒng)科技有限公司協(xié)同拿到中國郵儲銀行“集成電路工藝預(yù)訓(xùn)練模型金融場景運(yùn)用軟件定制開發(fā)”項(xiàng)目包。在多個(gè)壽險(xiǎn)公司內(nèi)部結(jié)構(gòu),對于大模型精心準(zhǔn)備的GPU網(wǎng)絡(luò)服務(wù)器購置、大數(shù)據(jù)應(yīng)用服務(wù)項(xiàng)目的招標(biāo)會,同樣在緊鑼密鼓地推動(dòng)。
據(jù)統(tǒng)計(jì),金融企業(yè)布署大模型主要有三種方法。
第一種,是獨(dú)立全棧自研,注重自立自強(qiáng)可控性。這也是一些AI基本比較好的大中型金融集團(tuán)合理布局大模型的路線之一。
第二種,在通用性大模型或者專業(yè)大模型前提下進(jìn)行微調(diào),結(jié)合自身實(shí)際海量信息和完善情景,產(chǎn)生切合個(gè)人需求的金融大實(shí)體模型。
第三種,從云端啟用,根據(jù)需求連接各種大模型API(應(yīng)用程序編程接口),進(jìn)行私有化部署?,F(xiàn)階段,百度文心一言、阿里巴巴的通義千問、騰訊太級大模型,都是有面對金融業(yè)搭建生態(tài)合作伙伴部署。
擁有很多分公司和需求場景的多樣化金融集團(tuán),通常選擇多種形式并駕齊驅(qū),并且在內(nèi)部形成淘汰機(jī)制;一些高新科技基本有待加強(qiáng)的中小金融機(jī)構(gòu),一般采用第三種方法,以節(jié)省成本。
應(yīng)對巨大市場的需求,各大廠商陸續(xù)開發(fā)設(shè)計(jì)金融大實(shí)體模型,一些金融理財(cái)公司并憑借往日在金融領(lǐng)域的積淀,公布兼容各種需求場景的垂直類金融大實(shí)體模型。
銷售市場火爆下,在今年的中國金融行業(yè)豎直大模型爭相公布。5月,度小滿金融發(fā)布中國首個(gè)開源的千億級漢語金融大實(shí)體模型“瑤光”;8月,馬上消費(fèi)公布第一個(gè)零售金融大模型“天鏡”;9月,螞蟻金融對于金融業(yè)深度定制的金融大實(shí)體模型AntFinGLM現(xiàn)身,并且在集團(tuán)公司里的財(cái)運(yùn)、保險(xiǎn)平臺上內(nèi)側(cè);10月,恒生電子金融大實(shí)體模型LightGPT更新,在科學(xué)金融業(yè)數(shù)據(jù)、合規(guī)要求及部署方案上取得突破,正式宣布三款大模型應(yīng)用產(chǎn)品對外開放首測。
度小滿金融技術(shù)總監(jiān)許冬亮在近日一場公開活動(dòng)中感慨:“近年來,緊緊圍繞生成式AI的熱潮,每周都有新迭代更新、新機(jī)遇,每天都能看到真實(shí)實(shí)際效果,有點(diǎn)兒爆發(fā)式發(fā)展趨勢、奇點(diǎn)臨近的感覺了?!?/p>
如雨后春筍般出現(xiàn)的金融大實(shí)體模型,也幫金融企業(yè)導(dǎo)致了型號選擇艱難。金融行業(yè)需要哪些大模型?在今年的9月,由信通院帶頭,協(xié)同騰訊云服務(wù)、訊飛科技、恒生電子、馬上消費(fèi)等40多家一同制訂了中國首個(gè)金融業(yè)行業(yè)大模型規(guī)范。該標(biāo)準(zhǔn)包括了金融大模型核心能力規(guī)定,包含情景契合度、水平支持率與應(yīng)用成熟情況三大方面。除此之外,規(guī)范還從金融行業(yè)特征考慮,覆蓋投研、投資咨詢、風(fēng)險(xiǎn)管控、網(wǎng)絡(luò)營銷、顧客服務(wù)等各個(gè)應(yīng)用領(lǐng)域,并詳細(xì)規(guī)定了金融大模型在數(shù)據(jù)信息合規(guī)、可溯源、私有化部署、風(fēng)險(xiǎn)管控等方面的要求。
“非常值得重做一遍
金融信息服務(wù)鏈”
與傳統(tǒng)人工智能技術(shù)對比,大模型可以為金融業(yè)做出什么貢獻(xiàn)增量價(jià)值?
假如說傳統(tǒng)式人工智能是專用、煙囪式的、單獨(dú)的,在語言模型時(shí)期,人工智能技術(shù)早已可以利用理論知識和邏輯推理能力,在特定領(lǐng)域全面地實(shí)行一段每日任務(wù)。
前段時(shí)間,一批數(shù)字員工被引入太保集團(tuán)審計(jì)中心,在審計(jì)檢查、文書質(zhì)量檢驗(yàn)、資詢互動(dòng)問答等相關(guān)工作環(huán)境下進(jìn)行水平示范點(diǎn),這種數(shù)字員工與真實(shí)人員進(jìn)行人機(jī)對戰(zhàn)編組,共同作業(yè)。太保智慧運(yùn)營科學(xué)研究院孫峰日前表示,大模型會帶來更多的方式改革,與傳統(tǒng)人工智能極大差別表現(xiàn)在思考模式、執(zhí)行力、實(shí)用性和邊際效益等多個(gè)方面?!按竽P统霈F(xiàn)的時(shí)候,完成了對人、對職位模型的概率?!?/p>
在互聯(lián)網(wǎng)金融方面,大模型水平同樣在顯露頭角。在今年的8月,馬上消費(fèi)公布“天鏡”大模型時(shí)公布,在長達(dá)3個(gè)月應(yīng)用,一個(gè)新的智能客服系統(tǒng)對顧客意圖理解準(zhǔn)確度做到91%,相對于傳統(tǒng)人工智能68%有明顯提升;顧客參與度61%,高過傳統(tǒng)式實(shí)體模型43%的參與度,也高于人力坐席均值28%的水準(zhǔn)。
在近日舉行保險(xiǎn)行業(yè)大模型論壇上,陽光保險(xiǎn)集團(tuán)科技中心副總顧青山詳細(xì)說明了“太陽正言”大模型開發(fā)者平臺。據(jù)了解,該方法在“夢客全線上銷售機(jī)器人”工程中,信息抽取每日任務(wù)準(zhǔn)確度提高了15%,意圖識別和智能問答準(zhǔn)確度均有明顯提升。
小螞蟻集團(tuán)副總裁、阿里小額貸款大模型負(fù)責(zé)人王曉航近日在金融街論壇中說,“金融信息服務(wù)鏈上的每一個(gè)重要環(huán)節(jié),都是值得用小實(shí)體模型改版一次”。
例如,把大模型與客戶洞察融合,提高互動(dòng)式理財(cái)感受;讓大模型創(chuàng)變權(quán)威專家投資理財(cái)保險(xiǎn)專家團(tuán)隊(duì),幫助提升專業(yè)水平;在數(shù)字化運(yùn)營層面,大模型能更好地了解顧客的融資需求、配對提供,還可以幫助形成營銷創(chuàng)意,提高廣告營銷效率。
在金融中后臺,大模型也能打開高效率室內(nèi)空間。例如,大模型在金融判斷、量化分析編號等多個(gè)方面,可以大量取代初中級至初級挑戰(zhàn)性的工作中,將行研投資分析師、風(fēng)險(xiǎn)策略工作人員、風(fēng)險(xiǎn)管理師從事務(wù)性工作工作中解脫出來。
“我看到了自主創(chuàng)新應(yīng)用場景的暴發(fā)和不斷涌現(xiàn)?!蓖鯐院秸f。
落地式穩(wěn)定性“沖關(guān)”
理想是美好的,生活的無奈。大模型時(shí)期,看起來一切都能重新構(gòu)建,但是當(dāng)金融企業(yè)把大模型部署到公司內(nèi)部的情況下,通常發(fā)覺考驗(yàn)很大。
“大模型如同一個(gè)優(yōu)秀的文科,邏輯推理、了解、語言表達(dá)能力強(qiáng)勁,但金融業(yè)投資行業(yè),開展風(fēng)險(xiǎn)定價(jià)、運(yùn)籌優(yōu)化、數(shù)據(jù)統(tǒng)計(jì)分析等眾多是理科生的工作中,大模型勝任不了。做科學(xué)嚴(yán)謹(jǐn)管理決策并非大模型的特長?!蓖鯐院秸f,“金融行業(yè)對穩(wěn)定性無與倫比的規(guī)定,與大模型‘天性爛漫’的錯(cuò)覺,存在明顯矛盾?!?/p>
穩(wěn)定性是大模型在金融領(lǐng)域落地式較大的鴻溝。通用性大模型對金融領(lǐng)域知識的缺乏,在精確性上面有顯著的短板,使之不太可能“拆箱就可以用”,還要親身經(jīng)歷復(fù)雜的工程并完成兼容。
為了能把大實(shí)體模型能夠更好地“手術(shù)縫合”到需求場景中,提高穩(wěn)定性、可靠性和流暢性,各大廠商的主力計(jì)劃方案有三種。一是把大模型與相關(guān)領(lǐng)域的小模型融合,大模型承擔(dān)認(rèn)知能力、了解、溝通交流、寫作,小模型承擔(dān)掌握風(fēng)險(xiǎn)性、承重科學(xué)嚴(yán)謹(jǐn)邏輯性;二是將大模型參數(shù)值知識和結(jié)構(gòu)型、有形化、靠譜金融數(shù)據(jù)倉庫緊密結(jié)合,這一舉動(dòng)能夠很好地為大模型引入穩(wěn)定性;三是將開放QA(互動(dòng)問答)和封閉QA融合,讓大模型獲得要求任務(wù)后,在專業(yè)技能領(lǐng)域里進(jìn)行檢索,大幅度提高精確性。
比如,度小滿金融公布的瑤光大模型,在通用性大模型基礎(chǔ)上增加了大量金融行業(yè)專業(yè)技能,從預(yù)訓(xùn)練開始調(diào)整實(shí)體模型,在中國銀行從業(yè)資格考試的解題表現(xiàn)中明顯好于通用性大模型。
算法訓(xùn)練絆腳石
不論是傳統(tǒng)式智能時(shí)代,或是大模型時(shí)期,數(shù)據(jù)都是基本。在實(shí)體模型行業(yè)時(shí)興一句話:“garbage in,garbage out”,即鍵入垃圾數(shù)據(jù)也會導(dǎo)致導(dǎo)出廢棄物結(jié)論,由此可見對于數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,信息是頭等大事。
據(jù)王曉航可能,我市場中有質(zhì)量的金融業(yè)語料庫,大約不上2000億tokens,但達(dá)到“高品質(zhì)、規(guī)模性、價(jià)值觀念恰當(dāng)”要求的語料庫占有率不上40%。在王曉航看起來,語料庫質(zhì)量保障措施遠(yuǎn)高于總數(shù)。
“本公司在大資管行業(yè)干了20多年來的歸一化處理,可是在實(shí)體模型眼前,仍覺得過去的工作十分初中級——每家機(jī)構(gòu)對于數(shù)據(jù)信息的要求都有各自的界定。”一位金融業(yè)IT服務(wù)提供商高管路出金融企業(yè)存放數(shù)據(jù)的現(xiàn)況:標(biāo)準(zhǔn)不統(tǒng)一,關(guān)系型數(shù)據(jù)庫多,數(shù)據(jù)治理工作繁雜。
華為盤古金融大實(shí)體模型人士透露,現(xiàn)階段金融企業(yè)最重要的任務(wù)之一,是如何將散落著需求場景里非結(jié)構(gòu)化的數(shù)據(jù)集和公司原來的高品質(zhì)數(shù)據(jù)相融合。
數(shù)據(jù)作為金融企業(yè)最主要的財(cái)產(chǎn),流動(dòng)性差是主要特點(diǎn)之一?,F(xiàn)階段,各家金融機(jī)構(gòu)引進(jìn)大實(shí)體模型全是私有化部署,分別練習(xí),以最大程度保障網(wǎng)絡(luò)信息安全、隱私和合規(guī)要求,卻也導(dǎo)致算力的消耗、數(shù)據(jù)庫系統(tǒng)資源浪費(fèi)和成本居高不下等諸多問題。
北京市本該高新科技經(jīng)理曹凱覺得,現(xiàn)階段金融大實(shí)體模型依舊是“學(xué)生水準(zhǔn)”,無法協(xié)助對投資趨勢開展洞悉,原因包括,模型參數(shù)指標(biāo)量不夠大,對產(chǎn)業(yè)、個(gè)人社保、工商局等多元化異構(gòu)體數(shù)據(jù)的積累不夠,且數(shù)據(jù)信息之間的相關(guān)性較差,不能達(dá)到大模型“不斷涌現(xiàn)”效果。
討論實(shí)際效果尚早
一位大中型壽險(xiǎn)公司科技部門人員將大模型布署全過程比成“賣家秀”變“淘寶買家秀”的一個(gè)過程。
他透露,企業(yè)推動(dòng)大模型環(huán)節(jié)中遇到了各類問題,包含但是不限于訓(xùn)練樣本難題、算率不足問題、投入與產(chǎn)出平衡問題、數(shù)據(jù)信息風(fēng)險(xiǎn)問題等。
他告誡,在實(shí)體模型應(yīng)用領(lǐng)域選擇時(shí),先要內(nèi)后外,有的放矢;需有托底體制,不可以只講智能化、并沒有人力,短時(shí)間也有推進(jìn)傳統(tǒng)式模型要求。“大模型所產(chǎn)生的虹吸現(xiàn)象,把許多IT資源都吸過去了,這對多樣化生態(tài)創(chuàng)新而言,不一定是件好事?!?/p>
孫峰還表示,該公司的“數(shù)字員工”項(xiàng)目要真正落地,仍是一件十分有挑戰(zhàn)性的工作。例如,要擁有強(qiáng)大的算率基本、基座大模型平臺作為支撐它運(yùn)行;要鍵入崗位所需的專業(yè)知識和數(shù)據(jù)信息,搭建數(shù)據(jù)辦公環(huán)境;此外,新項(xiàng)目真正落地時(shí)也會遇到新問題。
受實(shí)際環(huán)境的影響,金融大模型落地水平并不是想象中的那么高,討論效果更并非如此。恒生電子面對金融企業(yè)開展大實(shí)體模型發(fā)展趨勢調(diào)研顯示,71%受訪者所屬的組織已經(jīng)調(diào)查大模型,17%機(jī)構(gòu)早就在檢測中,真真正正落地實(shí)踐機(jī)構(gòu)不上10%。
共創(chuàng)綠色生態(tài)
“只靠自己一無是處”
連通大模型在金融行業(yè)落地最后一公里絕非易事。在編輯的采訪中,不論是大模型服務(wù)提供商、金融企業(yè),或是各種金融理財(cái)公司,在交流中均特別提到“綠色生態(tài)共創(chuàng)”,其內(nèi)涵包含“同創(chuàng)、共創(chuàng)、共建”,好似同赴一場“開卷考”。
前段時(shí)間,眾安在線發(fā)布保險(xiǎn)業(yè)第一份AIGC運(yùn)用圖普,幫助保險(xiǎn)公司在模式內(nèi)置入行業(yè)專業(yè)行業(yè)知識庫系統(tǒng),完成AIGC在基金垂直領(lǐng)域的運(yùn)用迅速兼容。
此前舉行的互聯(lián)網(wǎng)金融智慧運(yùn)營會議上,陽光保險(xiǎn)與此同時(shí)組織召開了“保險(xiǎn)科技智慧運(yùn)營創(chuàng)新聯(lián)合體”籌劃閉門會議。據(jù)了解,該聯(lián)合旨在推動(dòng)商業(yè)保險(xiǎn)垂直領(lǐng)域大模型的不斷深入研發(fā)和應(yīng)用,提高保險(xiǎn)行業(yè)總體智能化程度。
應(yīng)對大模型落地挑戰(zhàn)技術(shù)水平,太保集團(tuán)還認(rèn)為“只靠自身肯定是不行的”。據(jù)了解,太保與行業(yè)協(xié)同建立實(shí)驗(yàn)室,期待實(shí)現(xiàn)優(yōu)勢互補(bǔ),領(lǐng)域分享,責(zé)任共擔(dān)。在今年的進(jìn)博會上,太保與華為、訊飛科技建立了試驗(yàn)室,期待三方團(tuán)結(jié)起來面對一些考驗(yàn)。
促進(jìn)大模型在金融領(lǐng)域發(fā)揮更大的使用價(jià)值,社會各界一直在努力。日前,上海市人工智能研究院醫(yī)生宋海濤對小編代表,這家機(jī)構(gòu)正在推動(dòng)開設(shè)工業(yè)及加工制造業(yè)、金融等領(lǐng)域?qū)I(yè)詞庫,從而減少資源浪費(fèi)。
深圳市天使投資人引導(dǎo)基金副總徐向東覺得,現(xiàn)階段金融業(yè)存有信息化水平不夠、金融大數(shù)據(jù)流動(dòng)性枯竭、數(shù)據(jù)流圖不統(tǒng)一等諸多問題,牽制了一個(gè)大模型應(yīng)用。他呼吁,應(yīng)盡早培養(yǎng)數(shù)據(jù)要素市場,提升金融業(yè)歸一化處理,提高數(shù)據(jù)信息可靠、可以用、可商品流通、追朔水準(zhǔn),為大模型能夠更好地在金融業(yè)落地式發(fā)揮特長。
未經(jīng)數(shù)字化報(bào)網(wǎng)授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
特別提醒:如內(nèi)容、圖片、視頻出現(xiàn)侵權(quán)問題,請發(fā)送郵箱:tousu_ts@sina.com。
風(fēng)險(xiǎn)提示:數(shù)字化報(bào)網(wǎng)呈現(xiàn)的所有信息僅作為學(xué)習(xí)分享,不構(gòu)成投資建議,一切投資操作信息不能作為投資依據(jù)。本網(wǎng)站所報(bào)道的文章資料、圖片、數(shù)據(jù)等信息來源于互聯(lián)網(wǎng),僅供參考使用,相關(guān)侵權(quán)責(zé)任由信息來源第三方承擔(dān)。
本文地址: http:///news/53085.shtml
數(shù)字化報(bào)(數(shù)字化商業(yè)報(bào)告)是國內(nèi)數(shù)字經(jīng)濟(jì)創(chuàng)新門戶網(wǎng)站,以數(shù)字技術(shù)創(chuàng)新發(fā)展為中心,融合數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)發(fā)展,聚焦制造業(yè)、服務(wù)業(yè)、農(nóng)業(yè)等產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,致力為讀者提供最新、最權(quán)威、最全面的科技和數(shù)字領(lǐng)域資訊。數(shù)字化報(bào)并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù);
商務(wù)合作:Hezuo@szhww.com
稿件投訴:help@szhww.com
Copyright ? 2013-2023 數(shù)字化報(bào)(數(shù)字化報(bào)商業(yè)報(bào)告)
數(shù)字化報(bào)并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù)
浙ICP備2023000407號數(shù)字化報(bào)網(wǎng)(杭州)信息科技有限公司 版權(quán)所有浙公網(wǎng)安備 33012702000464號