深圳大學陳小軍:生成式人工智能助力全產業鏈數字化轉型
分類: 最新資訊
日志詞典
編輯 : 日志大全
發布 : 12-08
閱讀 :118
2023年12月5日,深圳市互聯網信息辦公室、寶安區人民政府、傳媒聯合主辦“2023新一代人工智能(深圳)創業大賽”頒獎典禮在深圳成功舉辦。“2023新一代人工智能(深圳)創業大賽”旨在促進人工智能的創新發展,助力人工智能初創企業健康成長。經過海選報名和多輪篩選比拼,大賽獲獎項目將由主辦方從現金、流量扶持、產業資源供需對接等多維度給予豐厚激勵。現場,“新一代人工智能產業聯盟”正式成立,未來將持續加強產業、資本、媒體、政府資源的鏈接,為創業者提供服務。現場,深圳大學大數據技術與應用研究所副所長陳小軍以《大模型助力數字化轉型
》為主題發表演講,分享了他對大模型及數字經濟的見解。他表示,以端、邊、云、網、智為代表的新IT,正在推動數字化轉型,實現全產業鏈、全價值鏈和全場景數字化。陳小軍教授表示,未來企業數字化轉型的架構將是以數據為中心的分層處理架構,傳統業務系統未來更多是作為數據提供方,把數據匯總起來形成數據底座;在數據底座之上再建立智能底座,在此之上支持各種各樣的智慧應用。陳小軍還闡述了他對未來數據架構的更多思考。在他看來,“首先底層有一個數據平臺,將各種各樣的數據匯總起來并進行數據治理,隨著數據交易的快速發展,可能未來還要考慮這個數據如何和外部進行交易。”同時,他認為需要在數據中臺的基礎上構造一個認知中臺,“這個認知中臺主要是利用人工智能方法對數據進行加工,獲得數據中的知識。這里面可能會包括一些領域知識庫、領域大模型、領域小模型、領域工具集”。接下來,他認為應該在數據中臺及認知中臺的基礎上去構建能力及應用。“基于數據中臺及認知中臺構建一個能力層,包括語義理解、語義檢索、智能分析、智能生成及智能決策。基于這種能力,再支持包括智慧城市、商業智能、智慧海關、社會治理、智慧金融等各種各樣的應用。”深圳大學大數據所一直聚焦大數據出爐,也取得了豐碩的成果,其研發的技術將有效地支持這種以數據為中心的分層處理架構。(記者:平章)以下為陳小軍演講節錄:非常感謝的邀請,今天有機會跟大家分享一下關于大模型助力數字化轉型方面的思考。首先介紹一下我自己,我自己是深圳大學大數據所的副所長,同時是中國計算機學會的理事,我自己在深圳已經待了十幾年,自己在人工智能、機器學習方面的研究也是研究了十幾年,而且有非常豐富的經驗。數字經濟是非常重要的熱點話題,數字經濟主要包含四個方面,包括數字產業化、產業數字化、數字化治理以及數據價值化四個方面,為什么數字經濟比較重要呢?可以看一下2020年全球數字經濟占GDP比重超過了40%,我們國家2022年占GDP的比重大概是41.5%,所以是非常重要的。同時數字化對企業也是非常重要,一是可以化解供需市場的波動,最近波動性特別強,構造以客戶為中心的服務運營體系有效化解一些風險。同時,我們最近新IT,就是以端、邊、云、網、智為代表的新IT,也在推動數字化轉型,實現全產業鏈、全價值鏈和全場景數字化。現在數字化的基礎特別好,經過疫情幾年,大家已經習慣了網上辦公、學習網購等等,所以有非常好的基礎。這里面重點的是新IT,和傳統比不一樣的是多了幾塊,一是混合型工作設備是多種多樣的,除了傳統的終端,比如說手機、服務器等等,其實我們還有各種各樣的IoT設備,以及邊緣計算設備。這里面邊緣計算、云計算、傳統數據中心會并存,推動我們建立一些新的基礎設施。同時,人工智能在這里面將會扮演越來越重要的作用,我們把“智”放在最上面,以前傳統人工智能沒有那么強,沒有過分地強調它。現在隨著GPT技術的成熟,我們希望人工智能在這里面扮演更重要的角色。可以看到在傳統企業中,傳統的架構是一種垂直架構,主要是從功能點出發來將不同的軟件系統給集成起來,這種系統在數字化轉型之后,它會遇到非常大的問題,特別是數據是不暢的,在各個系統中是不暢的,很難有效地匯總起來進行分析處理。未來將會過渡到新的架構是數字脫分層架構,傳統業務系統未來更多的是作為一種數據的提供方,我們把這些數據匯總起來可以形成一個數據底座,在數據底座之上再建立智慧大腦,提供智慧服務。中間可能是一些通用大模型、任務大模型以及行業大模型,在此之上支持各種各樣的智慧應用。我們的思考未來可能是這樣一種數據架構,首先底層有一個數據中臺,將各種各樣的數據處理起來,你要做的事是數據匯總和數據治理,隨著數據交易的快速發展,可能未來還要考慮這個數據如何和外部進行交易。在數據中臺的基礎上構造一個認知層,這個認知層主要是對數據的一個應用,這里面可能會包括一些領域知識庫、領域大模型、領域小模型、領域工具集,形成數字中臺。之后再構建一個能力層,是語義理解、語義檢索等等,之后才是應用層。數據層面上要考慮到底需要什么樣的數據,如果數據不夠可以通過數據交易的方式引入第二是數據從哪里來,怎么采集,未來的采集場景會越來越多、越來越豐富。第三是如何確保數據可用、能用額是非常重要的。對于大模型而言,我們也有很重要的事,現在通用大模型到應用上也要考慮很多的轉變,比如說任務怎么定義,不同模態、不同場景、不同用戶之間怎么對齊。怎么樣降本,現在大模型的成本非常高,很多中小企業是很難用得起的,這也是非常重要的一件事。模型也需要評測,能力怎么評測?怎么分級,二是數據指標怎么定義,現在評測非常多,這些評測和企業應用是否相關也可以看一下,很多不一定是特別相關的。輸出如何可信?如果不可信人工智能在應用中使用是非常受阻的。在實施部署中要考慮幾件事,一是可靠非常重要,現在在大模型公司內部訓練時,大模型經常要出問題的,雖然我們外面用沒有這種感覺。二是經濟性,成本非常重要,現在大模型賣得非常貴,直接賣大模型非常貴,但是沒API的價格相對合適,企業要考慮如何選型。三時效性非常重要,怎么樣去更新,而且更新的頻率都非常關鍵,特別是對于企業內部的數據,我們希望能夠用到最新的數據,怎么去做也是一個問題。四是數據安全是非常重要的。剩下的時間主要跟大家分享一下我們之前做的一些事。第一是和政務行業的數字化轉型,這是我們和海關合作多年的項目,深圳海關毗鄰香港,反腐敗形勢長期嚴峻復雜,同時深圳海關監管模式復雜,包含陸運、海運、空運、特殊監管區、跨境電商、快件等不同監管方式,監管過程的申報、布控、審單等業務環節中,極易出現權利尋租的廉政風險,迫切需要數據手段提升監督效能,改善營商環境。比如說最近國家高度重視的一個問題是外貿的產業鏈供應鏈韌性問題。通過對進出口數據開展一系列風險量化分析,為優化產業結構,助企興業提供精準數據支持。我們在圍繞智慧海關創新應用做了一些有益的探索,首先把海關的核心業務系統數據進行深度治理,形成完整的進出口業務數據鏈條,搭建數據中臺,在此基礎上構建面向分析的智慧大腦計算引擎。該引擎支撐了包括智慧紀檢、智慧稽查、智慧關稅、智慧加貿、智慧統計等多種智慧海關應用。第二是零售行業的數字化拴性,零售行業是非常底層的行業,這個行業也受到數字化、人工智能的技術沖擊是非常大的,如果不做轉型肯定很多就會倒閉,或者說已經倒閉了很多,我們接觸這家的眼光還是比較長遠,很早就開始做一些事了。這家公司的數字化第一階段是2003年以前是一個傳統的事,2003年之前就是系統化,確保這個東西有系統支撐,不可能和小攤販是一樣的,我們看到典型的是有一套POS和ERP的系統就不錯了,門店的進銷存管理就不錯了。
隨著零售系統的進一步演變和發展,第二階段是2014年左右,這時候就形成了線上線下一體化,回去看到正好這些年在2014年之前,2010年左右線上這塊確實也是飛速地發展起來,像淘寶的發展,很多公司也要進行轉變。所以2014年時就是線上線下一體化的體系,2014年成立全資科技公司,還有500人做研發,100人做運營,就不是傳統的零售,絕大部分都是搞賣東西或者是庫存管理,有點向科技公司轉變了。包括構建了會員、庫存、到店交易體系,因為它是一個全國的連鎖店比較多,這套系統也非常噴大。隨著這幾年的發展之后進入到另外一個階段,這幾年越來越多的交易來自于線上了,所積累的線上數據也越來越多了,加上競爭是越來越激烈,所以第三階段要做的事是公私域的精準經銷,傳統的架構里,數據在公司的內部系統中流轉,但現在需要和包括抖音、微信等外部營銷系統有效對接起來。這是2019年左右做的事。當前,隨著人工智能技術的飛速發展,如何利用人工智能技術提供更好的服務,是近期大家都在思考和嘗試的事。相信過幾年后零售業將進入到下一階段,人工智能將在里面發揮更大的作用。我今天就匯報到這兒,謝謝。