隨著人工智能技術(shù)的快速發(fā)展,金融行業(yè)正在迎來前所未有的智能化變革。
近日,2025金融科技大會“新型數(shù)字基礎(chǔ)設(shè)施”在蘇州舉辦。會上,百度智能云金融業(yè)務部總經(jīng)理徐旭圍繞金融行業(yè)的大模型基礎(chǔ)設(shè)施建設(shè),分享了百度智能云在過去幾年深度參與金融機構(gòu)智能轉(zhuǎn)型的經(jīng)驗與觀察。他指出:大模型已進入金融機構(gòu)的高強度、真實業(yè)務負載階段,AI云全棧能力正成為金融行業(yè)邁入智能化躍遷期的關(guān)鍵引擎。
徐旭表示,目前國內(nèi)已有金融機構(gòu)在內(nèi)部大模型服務上日調(diào)用量突破百億Tokens,逼近互聯(lián)網(wǎng)級別的供給強度。這意味著大模型在銀行、保險、證券等金融場景中的應用已從試點階段全面進入規(guī)模化落地階段。
與此同時,全球范圍內(nèi)的大模型仍在沿著ScalingLaw快速擴展至萬億量級。盡管PD分離、MoE架構(gòu)等工程優(yōu)化不斷降低單Tokens成本,但超大規(guī)模模型依舊對金融行業(yè)的計算基礎(chǔ)設(shè)施提出了前所未有的壓力,形成“模型規(guī)模、算力成本、吞吐性能”難以同時最優(yōu)的“三難困境”。
更重要的是,大模型的應用場景也在發(fā)生明顯遷移:從內(nèi)部輔助工具,快速向客戶經(jīng)理助手、客服助手、財富管理助手等前臺、面客類業(yè)務延伸。這些場景要求更高并發(fā)、更低時延,使得金融行業(yè)必須重新思考如何構(gòu)建可持續(xù)、可擴展的智能底座。
徐旭指出,金融機構(gòu)不僅需要使用通用基礎(chǔ)模型,也迫切需要圍繞信用風控、交易監(jiān)測、客戶服務、合規(guī)審查等垂直場景構(gòu)建“專精模型”。隨著強化學習數(shù)據(jù)飛輪啟動,模型訓練已經(jīng)從過去的“周級、天級”,加速進入“天級、小時級”的頻繁迭代。
同時,為滿足自主可控的要求,金融機構(gòu)在底層算力層面臨異構(gòu)化挑戰(zhàn),這進一步加劇了智能基礎(chǔ)設(shè)施的復雜度。在這一背景下,金融機構(gòu)面臨的核心命題可總結(jié)為四點:高效的算力供給、穩(wěn)定的服務、靈活的共享調(diào)度、可持續(xù)的經(jīng)濟性。
徐旭強調(diào),要破解這一復雜命題,關(guān)鍵在于跳出單一組件的思維,以“選用管”的系統(tǒng)化理念來重構(gòu)智能基礎(chǔ)設(shè)施。
百度智能云的獨特優(yōu)勢在于其覆蓋算力、模型到應用的AI云全棧能力,能夠提供軟硬一體、價值驅(qū)動的優(yōu)化方案。在“選”與“用”的層面,百度智能云倡導以場景驅(qū)動,實現(xiàn)算力價值最大化。通過其自研的昆侖芯和百舸AI計算平臺,為金融機構(gòu)提供了高經(jīng)濟性和高適配性的算力底座。
昆侖芯P800不僅性能卓越,更易于部署。據(jù)項目實測,其僅需不到200卡規(guī)模的服務器集群即可完成千億參數(shù)模型的全參數(shù)訓練,可快速提升多模態(tài)數(shù)據(jù)分析、智能客服、代碼助手等場景的應用效能,部分多模態(tài)模型推理性能達到行業(yè)領(lǐng)先水平。某股份制銀行的案例顯示,通過昆侖芯的集群部署,以不到百卡芯片的規(guī)模,高效支撐了熱點流量窗口下日均百億Tokens的大模型服務。
在“管”的層面,百度智能云推出了百舸AI計算平臺,構(gòu)建了“都江堰”式的算力治理體系。面對昂貴且異構(gòu)的算力資源,“百舸”平臺實現(xiàn)了對底層智算云底座和昆侖芯的深度感知與統(tǒng)一抽象。它不僅能確保任務調(diào)度的高效匹配,更將保障金融業(yè)務的穩(wěn)定可靠放在首位,通過故障的快速診斷、自愈和自動化隔離機制,確保了單一訓練任務99.5%的高可用率。
更重要的是,百舸具備強大的異構(gòu)資源池化和潮汐調(diào)度能力,能夠統(tǒng)一管理和分配不同型號、不同地理位置的算力資源,通過資源超發(fā)和高優(yōu)先級任務搶占,打破了算力孤島,最大化了算力資源的共享和利用率。
徐旭表示,未來,百度智能云將持續(xù)以AI云全棧的整體優(yōu)勢,深度參與金融機構(gòu)的智能時代基礎(chǔ)設(shè)施建設(shè),提供穩(wěn)定、高效、經(jīng)濟的“核心引擎”,助力金融機構(gòu)在服務實體經(jīng)濟、寫好“五篇大文章”的進程中,搶占新一輪競爭的制高點。


