AI產(chǎn)業(yè)化的發(fā)展不僅離不開(kāi)算法和算力,也離不開(kāi)良好和龐大的數(shù)據(jù)演練。因此進(jìn)一步打通國(guó)內(nèi)數(shù)據(jù)使用通道,提升大模型演練中數(shù)據(jù)的可獲得性,成為推動(dòng)AI產(chǎn)業(yè)化發(fā)展的重要步驟。
作為現(xiàn)代科技的重要組成部分,深入推進(jìn)人工智能(AI)技術(shù)發(fā)展,將在我國(guó)經(jīng)濟(jì)高質(zhì)量發(fā)展中扮演越來(lái)越重要的角色。2023年2月ChatGPT問(wèn)世,標(biāo)志著AI技術(shù)的商業(yè)化落地進(jìn)入全新階段。隨著大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等信息技術(shù)的發(fā)展,泛在感知數(shù)據(jù)和通用圖形處理器推動(dòng),以深度神經(jīng)網(wǎng)絡(luò)為代表的AI技術(shù)飛速發(fā)展,大幅跨越了科學(xué)與應(yīng)用之間的“技術(shù)鴻溝”,迎來(lái)爆發(fā)式增長(zhǎng)的新高潮。眾所周知,AI是由算力、算法和數(shù)據(jù)三部分組成。目前,算法較難取得創(chuàng)新,算力核心在于芯片,短期仍有所受限。從某種程度上來(lái)說(shuō),數(shù)據(jù)的規(guī)模和質(zhì)量已經(jīng)成為決定AI發(fā)展水平的關(guān)鍵。
OpenAI在2023年11月7日于首屆開(kāi)發(fā)者大會(huì)DevDay上宣布了GPTs,用戶(hù)可以通過(guò)自定義指令、拓展(模型)的知識(shí)邊界和下達(dá)行動(dòng)命令,來(lái)構(gòu)建自己的GPT。大模型發(fā)展在國(guó)外已日趨成熟,在國(guó)內(nèi)則亟待進(jìn)一步推動(dòng)。AI產(chǎn)業(yè)化的發(fā)展不僅離不開(kāi)算法和算力,也離不開(kāi)良好和龐大的數(shù)據(jù)演練。因此進(jìn)一步打通國(guó)內(nèi)數(shù)據(jù)使用通道,提升大模型演練中數(shù)據(jù)的可獲得性,成為推動(dòng)AI產(chǎn)業(yè)化發(fā)展的重要步驟。
一是充分發(fā)揮中國(guó)海量數(shù)據(jù)的規(guī)模優(yōu)勢(shì),打通公域和私域數(shù)據(jù)分割,驅(qū)動(dòng)各類(lèi)數(shù)據(jù)共享,在確保數(shù)據(jù)安全前提下,推動(dòng)AI對(duì)復(fù)雜多場(chǎng)景的應(yīng)用能力。
直到目前,AI技術(shù)仍處于發(fā)展中階段,主要障礙是數(shù)據(jù)規(guī)模還不夠龐大以及機(jī)器人對(duì)現(xiàn)實(shí)場(chǎng)景切換的應(yīng)變能力還不夠充分的智能化。相對(duì)而言,中國(guó)擁有超過(guò)10億的網(wǎng)民數(shù)量,互聯(lián)網(wǎng)普及率接近80%,5G基站數(shù)近200萬(wàn)個(gè),5G移動(dòng)電話(huà)用戶(hù)接近5億。這些基礎(chǔ)因素決定了中國(guó)擁有強(qiáng)大的數(shù)據(jù)生產(chǎn)能力,而且數(shù)據(jù)不僅僅是通過(guò)手機(jī)、電腦生成,還包括各種各樣傳統(tǒng)的離線(xiàn)商業(yè)活動(dòng),如共享單車(chē)、醫(yī)療掃描、考勤打卡、金融支付、衛(wèi)星圖像等。這意味著,在下一輪新科技競(jìng)爭(zhēng)中,如果我國(guó)能夠快速提升數(shù)據(jù)供給能力、優(yōu)化數(shù)據(jù)供給結(jié)構(gòu),這將筑牢海量數(shù)據(jù)規(guī)模和豐富應(yīng)用場(chǎng)景的基礎(chǔ)優(yōu)勢(shì),極有可能在大規(guī)模圖形計(jì)算、智能數(shù)據(jù)工程等方面取得重大突破。
比如,國(guó)內(nèi)數(shù)據(jù)市場(chǎng)如圖書(shū)數(shù)據(jù)等,這些數(shù)據(jù)由于版權(quán)原因,仍掌握在部分版權(quán)使用者上,或是由于使用規(guī)定尚未明確,無(wú)法被合理使用。再如,出于數(shù)據(jù)安全的考慮,公域數(shù)據(jù)和私域數(shù)據(jù)以及不同平臺(tái)的數(shù)據(jù)尚未完全打通,數(shù)據(jù)分割勢(shì)必削弱AI技術(shù)產(chǎn)業(yè)化的步伐,導(dǎo)致大模型無(wú)法獲得此類(lèi)數(shù)據(jù)。客觀而言,大模型部分功能的缺失,并不利于大模型發(fā)展升級(jí),也不利于激發(fā)AI技術(shù)開(kāi)發(fā)的積極性。因此,打通地區(qū)和平臺(tái)數(shù)據(jù)分割,促進(jìn)數(shù)據(jù)市場(chǎng)一體化發(fā)展,才能助力大模型演練,達(dá)到AI推動(dòng)經(jīng)濟(jì)高質(zhì)量發(fā)展的目標(biāo)。
二是深化數(shù)據(jù)資源開(kāi)發(fā),聚焦AI服務(wù)實(shí)體經(jīng)濟(jì)領(lǐng)域,依托龍頭企業(yè)打造數(shù)據(jù)、知識(shí)、算法“三位一體”的關(guān)鍵節(jié)點(diǎn),增強(qiáng)實(shí)體經(jīng)濟(jì)智能化場(chǎng)景效能。
《AI全域變革圖景展望:躍遷點(diǎn)來(lái)臨(2023)》報(bào)告顯示,截至2023年6月底,全球AI企業(yè)共計(jì)3.6萬(wàn)家,中美企業(yè)數(shù)量名列前茅。美國(guó)AI企業(yè)數(shù)量約1.3萬(wàn)家,在全球占比達(dá)到33.6%,中國(guó)占比為16.0%。另?yè)?jù)胡潤(rùn)研究院發(fā)布的《2023全球獨(dú)角獸榜》,美國(guó)以666家獨(dú)角獸企業(yè)領(lǐng)先,占全球獨(dú)角獸總數(shù)的49%。中國(guó)以316家位居第二,中國(guó)獨(dú)角獸數(shù)量比后面15個(gè)國(guó)家加在一起還要多。因此,在AI創(chuàng)新方面,中國(guó)和美國(guó)同樣躋身全球第一梯隊(duì)。
但在應(yīng)用場(chǎng)景上,中國(guó)的AI主要面向推動(dòng)工業(yè)4.0和“智能制造”,重點(diǎn)集中在工業(yè)制造、物流和零售等。這里有兩個(gè)數(shù)據(jù)充分體現(xiàn)這一點(diǎn),如2022年中國(guó)工業(yè)機(jī)器人裝機(jī)量占全球比重超50%,穩(wěn)居全球第一大工業(yè)機(jī)器人市場(chǎng)。再如,2022年中國(guó)在AI相關(guān)半導(dǎo)體私人投資的金額為1.02億美元,是美國(guó)的1.75倍。
從這個(gè)意義上講,促進(jìn)中國(guó)AI技術(shù)的發(fā)展,必須緊緊圍繞賦能實(shí)體經(jīng)濟(jì)這一核心目標(biāo)。為此,進(jìn)一步深化各省市《數(shù)據(jù)條例》的有關(guān)配套政策,依托AI獨(dú)角獸企業(yè)較多的重點(diǎn)城市如北京、上海、深圳、廣州、杭州等,賦權(quán)研究探索出臺(tái)數(shù)據(jù)流通等專(zhuān)項(xiàng)法規(guī),對(duì)數(shù)據(jù)關(guān)鍵技術(shù)、標(biāo)桿生產(chǎn)制造場(chǎng)景等予以支持。積極探索AI等技術(shù)賦能產(chǎn)業(yè),如在電商領(lǐng)域,目前“AI+電商”的相關(guān)技術(shù)主要已開(kāi)始應(yīng)用于AI選品、圖文和視頻廣告素材制作/廣告語(yǔ)智能輸出、廣告智能投放、智能客服回復(fù)等方面。以亞馬遜為例,已通過(guò)AI賦能跨境電商的選品、營(yíng)銷(xiāo)和物流等多個(gè)環(huán)節(jié)。因此,我國(guó)可借助自身AI產(chǎn)業(yè)優(yōu)勢(shì),積極推動(dòng)AI和跨境電商等新業(yè)態(tài)之間融合。
三是夯實(shí)數(shù)據(jù)領(lǐng)域標(biāo)準(zhǔn),高質(zhì)量發(fā)展需要相應(yīng)的高標(biāo)準(zhǔn)作為支撐,發(fā)揮標(biāo)準(zhǔn)引領(lǐng)支撐作用,推動(dòng)標(biāo)準(zhǔn)化與科技創(chuàng)新互動(dòng)發(fā)展,加強(qiáng)關(guān)鍵技術(shù)領(lǐng)域標(biāo)準(zhǔn)研究。
DEPA(數(shù)字經(jīng)濟(jì)伙伴關(guān)系協(xié)定)中已明確提出,締約方應(yīng)努力促進(jìn)采用支持可信、安全和負(fù)責(zé)任使用AI技術(shù)的道德和治理框架。AI治理的重要組成就是數(shù)據(jù)治理和標(biāo)準(zhǔn)制定。全球AI治理框架尚未明確,這是個(gè)全新的規(guī)則領(lǐng)域,也是中國(guó)及早加入的機(jī)遇。AI標(biāo)準(zhǔn)化為產(chǎn)品和服務(wù)質(zhì)量提供保障,并保障信息安全,有效減少AI技術(shù)帶來(lái)的信息安全、個(gè)人隱私等問(wèn)題。為此,我國(guó)2020年就印發(fā)了《國(guó)家新一代AI標(biāo)準(zhǔn)體系建設(shè)指南》,構(gòu)筑了AI標(biāo)準(zhǔn)體系,形成標(biāo)準(zhǔn)引領(lǐng)AI產(chǎn)業(yè)發(fā)展的新格局。此后,針對(duì)AI計(jì)算平臺(tái)的國(guó)家標(biāo)準(zhǔn)啟動(dòng)編制,并在生物特征識(shí)別、智能汽車(chē)等AI應(yīng)用領(lǐng)域發(fā)布了多項(xiàng)國(guó)家標(biāo)準(zhǔn)。國(guó)家網(wǎng)信辦2023年7月公布《生成式AI服務(wù)管理暫行辦法》,統(tǒng)籌安全與發(fā)展,對(duì)生成式AI研發(fā)及服務(wù)做了明確規(guī)定,保障AI的良性發(fā)展和創(chuàng)新。
但目前,我國(guó)在硬件方面仍面臨著不同場(chǎng)景下的AI硬件指令集、微架構(gòu)設(shè)計(jì)不同的問(wèn)題,亟待統(tǒng)一的規(guī)范標(biāo)準(zhǔn)。AI安全基礎(chǔ)標(biāo)準(zhǔn)、關(guān)鍵應(yīng)用方向安全保護(hù)標(biāo)準(zhǔn)、機(jī)器學(xué)習(xí)模型標(biāo)準(zhǔn)乃至硬件虛擬接口、開(kāi)發(fā)框架兼容規(guī)范等標(biāo)準(zhǔn),都亟待進(jìn)一步規(guī)范。此外,AI編譯工具之間的融合性有待提升。因此,上海應(yīng)發(fā)揮先行先試優(yōu)勢(shì),加強(qiáng)與ISO等國(guó)際標(biāo)準(zhǔn)組織的合作,參與國(guó)際標(biāo)準(zhǔn)制定,并圍繞試點(diǎn)示范項(xiàng)目,探索我國(guó)AI標(biāo)準(zhǔn)培育,加快AI訓(xùn)練數(shù)據(jù)等相關(guān)標(biāo)準(zhǔn)文件的發(fā)布,穩(wěn)步擴(kuò)大規(guī)則、標(biāo)準(zhǔn)等制度型開(kāi)放,為中國(guó)式現(xiàn)代化開(kāi)辟新路。
總而言之,數(shù)據(jù)是新型生產(chǎn)要素,是數(shù)字化、網(wǎng)絡(luò)化、智能化的先決條件。AI是數(shù)據(jù)密集型行業(yè),也是新一輪科技革命和產(chǎn)業(yè)革命的驅(qū)動(dòng)力量,積極推動(dòng)數(shù)據(jù)的安全有效訓(xùn)練、管理和使用,全面加快數(shù)據(jù)融入生產(chǎn)、分配、流通、消費(fèi)和社會(huì)服務(wù)管理等各環(huán)節(jié),是做大做強(qiáng)我國(guó)AI產(chǎn)業(yè)的基本路徑。實(shí)踐中,2023年2月中共中央、國(guó)務(wù)院也印發(fā)了《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》,強(qiáng)調(diào)“到2025年將基本形成橫向打通、縱向貫通、協(xié)調(diào)有力的一體化推進(jìn)格局,數(shù)字中國(guó)建設(shè)取得重要進(jìn)展;到2035年,數(shù)字化發(fā)展水平進(jìn)入世界前列”。此后,全國(guó)各地立刻響應(yīng),掀起了AI產(chǎn)業(yè)快速發(fā)展的浪潮。
公開(kāi)數(shù)據(jù)顯示,截至目前我國(guó)在空間上已經(jīng)形成長(zhǎng)三角、京津冀、珠三角三大AI產(chǎn)業(yè)集聚發(fā)展區(qū)。特別是在新一輪生成式AI熱潮中,全國(guó)已經(jīng)出現(xiàn)了106個(gè)大模型,其中北京的大模型公司數(shù)量和研發(fā)數(shù)量均占據(jù)“C位”,多達(dá)54個(gè);上海在AI算力方面積累了優(yōu)勢(shì);深圳、廣州、杭州、成都等城市也都有多個(gè)大模型公司。
我們有充分理由相信,在數(shù)字化變革的推動(dòng)下,中國(guó)有望在AI領(lǐng)域獲得率先突破,由AI技術(shù)發(fā)展的產(chǎn)業(yè)化應(yīng)用所迸發(fā)的強(qiáng)大新質(zhì)生產(chǎn)力,將促進(jìn)我國(guó)未來(lái)經(jīng)濟(jì)和社會(huì)的智慧化發(fā)展,助力中國(guó)式現(xiàn)代化和經(jīng)濟(jì)高質(zhì)量發(fā)展的目標(biāo)愿景。
來(lái)源:第一財(cái)經(jīng),01-29
作者:徐乾宇,上海社會(huì)科學(xué)院世界經(jīng)濟(jì)研究所助理研究員;胡曉鵬,上海社會(huì)科學(xué)院世界經(jīng)濟(jì)研究所副所長(zhǎng)、研究員