主權(quán)級(jí)大模型,AI博弈新場(chǎng)域
文 | 韓卓希 北京大學(xué)全球互聯(lián)互通研究中心助理研究員、劉學(xué)洋 北京大學(xué)軟件工程國(guó)家工程研究中心副教授
英偉達(dá)GTC年度開(kāi)發(fā)者大會(huì)正在舉行,市場(chǎng)普遍將之視為世界AI發(fā)展的一個(gè)風(fēng)向標(biāo)。這一行業(yè)熱潮,也折射出全球AI競(jìng)爭(zhēng)日趨白熱化。自ChatGPT問(wèn)世后,多國(guó)紛紛跟進(jìn)大語(yǔ)言模型技術(shù),圍繞“主權(quán)級(jí)大模型”的全球戰(zhàn)略博弈也隨之拉開(kāi)序幕。
當(dāng)前,大模型訓(xùn)練高度依賴(lài)海量高質(zhì)量數(shù)據(jù)和人類(lèi)反饋強(qiáng)化學(xué)習(xí)技術(shù)。這兩大技術(shù)特點(diǎn),使得通過(guò)調(diào)整訓(xùn)練數(shù)據(jù)、引導(dǎo)人類(lèi)反饋偏好,向大模型注入特定觀點(diǎn)和價(jià)值觀成為可能。這也直接催生了“主權(quán)級(jí)大模型”的概念。
主權(quán)級(jí)大模型的“主權(quán)”屬性,要求該模型需與國(guó)家立場(chǎng)對(duì)齊。技術(shù)政治時(shí)代,主權(quán)級(jí)大模型與一國(guó)國(guó)家安全、國(guó)家戰(zhàn)略緊密相連。中國(guó)的區(qū)域國(guó)別學(xué)可為訓(xùn)練這類(lèi)大模型構(gòu)建高質(zhì)量且安全的訓(xùn)練數(shù)據(jù)集,促使主權(quán)級(jí)大模型進(jìn)一步對(duì)齊國(guó)家立場(chǎng),服務(wù)國(guó)家戰(zhàn)略。
主權(quán)級(jí)大模型是國(guó)家統(tǒng)籌發(fā)展和安全的關(guān)鍵基礎(chǔ)設(shè)施。當(dāng)前,大模型被認(rèn)為是AI領(lǐng)域最重要的軟件基礎(chǔ)設(shè)施,是可能通向通用人工智能的主要技術(shù)途徑。由此而來(lái)的一個(gè)事關(guān)國(guó)家戰(zhàn)略的核心問(wèn)題是:如果使用開(kāi)源模型,那么由誰(shuí)掌控訓(xùn)練數(shù)據(jù)?其訓(xùn)練數(shù)據(jù)是否直接關(guān)乎一個(gè)國(guó)家的文化、經(jīng)濟(jì)、安全?正因如此,各國(guó)愈發(fā)關(guān)注自主人工智能,力爭(zhēng)自主掌握并運(yùn)用人工智能技術(shù)帶來(lái)的戰(zhàn)略優(yōu)勢(shì)。
自主人工智能包含兩大支柱:物理基礎(chǔ)設(shè)施和數(shù)據(jù)基礎(chǔ)設(shè)施,后者的核心正是主權(quán)級(jí)大模型。根據(jù)業(yè)內(nèi)的普遍理解,主權(quán)級(jí)大模型是由本土團(tuán)隊(duì)開(kāi)發(fā)、使用本地?cái)?shù)據(jù)集訓(xùn)練的大型語(yǔ)言模型。也就是說(shuō),該大模型符合研發(fā)國(guó)的政治制度、文化、宗教和價(jià)值觀,是該國(guó)重要的人工智能基礎(chǔ)設(shè)施。其優(yōu)勢(shì)在于能夠有效保障國(guó)家的數(shù)據(jù)隱私和安全,無(wú)需過(guò)度依賴(lài)他國(guó)開(kāi)發(fā)的人工智能大模型。目前,很多國(guó)家宣布構(gòu)建服務(wù)自身的主權(quán)級(jí)大模型。比如,法國(guó)初創(chuàng)公司Mistral AI成立僅兩年,就宣布與英偉達(dá)合作推出專(zhuān)注于人工智能的主權(quán)計(jì)算基礎(chǔ)設(shè)施??梢哉f(shuō),發(fā)展主權(quán)級(jí)大模型等自主的人工智能能力被視為確保一國(guó)“數(shù)字主權(quán)”的關(guān)鍵。
主權(quán)級(jí)大模型與國(guó)家安全能力建設(shè)緊密相關(guān)。一方面,因“主權(quán)”屬性,大模型擁有使用國(guó)政治、經(jīng)濟(jì)、軍事等多方面數(shù)據(jù),對(duì)該國(guó)制定發(fā)展戰(zhàn)略、維護(hù)國(guó)家安全等相關(guān)舉措具有直接而重大的影響。此外,融入一國(guó)社會(huì)運(yùn)行、發(fā)展的主權(quán)級(jí)大模型,可對(duì)該國(guó)文化起到“編碼”的作用。大模型所依賴(lài)的數(shù)據(jù)庫(kù),直接決定其如何塑造國(guó)民對(duì)自身與世界的認(rèn)知,這也是“主權(quán)”屬性的另一層含義。其不直接攻擊物理或技術(shù)系統(tǒng),而是從深層次上改變?nèi)藗儗?duì)世界的理解與行為邏輯。西方國(guó)家對(duì)該領(lǐng)域有較多論述與設(shè)計(jì),先后發(fā)展出輿論戰(zhàn)、心理戰(zhàn)、認(rèn)知戰(zhàn)、模因戰(zhàn)等概念及相關(guān)策略。
另一方面,缺乏自主可控的主權(quán)級(jí)大模型,會(huì)直接危及一國(guó)國(guó)家安全。受技術(shù)、資金以及基礎(chǔ)設(shè)施等限制,部分發(fā)展中國(guó)家尚不具備自主構(gòu)建主權(quán)級(jí)大模型的能力。主權(quán)級(jí)大模型能夠提供遠(yuǎn)超人力的強(qiáng)大算力,以更為客觀、可量化的方式來(lái)分析國(guó)內(nèi)輿論態(tài)勢(shì)、經(jīng)濟(jì)社會(huì)走勢(shì)以及其他國(guó)家外交政策走向等,進(jìn)而為國(guó)家戰(zhàn)略決策提供參考乃至發(fā)揮預(yù)警作用。不掌握主權(quán)級(jí)大模型的國(guó)家很可能陷入“落后挨打”的處境,國(guó)際秩序中將因此出現(xiàn)國(guó)與國(guó)“AI主權(quán)”不平等的現(xiàn)象。就此而言,有能力構(gòu)建主權(quán)級(jí)大模型的國(guó)家,有責(zé)任幫助缺乏條件的國(guó)家建設(shè)屬于自己的主權(quán)級(jí)大模型。
主權(quán)級(jí)大模型的“主權(quán)”屬性,要求該模型必須服務(wù)國(guó)家戰(zhàn)略并體現(xiàn)使用國(guó)價(jià)值觀。該模型并非僅僅將特定國(guó)家數(shù)據(jù)進(jìn)行統(tǒng)一整理,而是基于該國(guó)獨(dú)特的數(shù)據(jù)、研究和歷史,通過(guò)對(duì)數(shù)據(jù)進(jìn)行專(zhuān)業(yè)性標(biāo)注、清洗,訓(xùn)練而成的、能夠體現(xiàn)該國(guó)特色的工具。區(qū)域國(guó)別學(xué)的初衷是服務(wù)國(guó)家戰(zhàn)略,與主權(quán)級(jí)大模型的“主權(quán)”屬性要求一致,可為主權(quán)級(jí)大模型提供高質(zhì)量大數(shù)據(jù)集及系列訓(xùn)練邏輯。
區(qū)域國(guó)別學(xué)能夠?yàn)橹鳈?quán)級(jí)大模型構(gòu)建注入結(jié)構(gòu)化、系統(tǒng)化的知識(shí)圖譜,例如評(píng)估關(guān)鍵海峽通道的地緣政治風(fēng)險(xiǎn)、不同國(guó)家間領(lǐng)土爭(zhēng)端現(xiàn)狀與歷史脈絡(luò)、一國(guó)國(guó)際形象在特定地區(qū)傳播效果等。
更重要的是,區(qū)域國(guó)別學(xué)學(xué)者能夠憑借自身語(yǔ)言能力、專(zhuān)業(yè)基礎(chǔ),對(duì)海量數(shù)據(jù)進(jìn)行甄別、清洗、標(biāo)注以及評(píng)估,有效識(shí)別信息操縱,規(guī)避敏感議題,構(gòu)建一個(gè)高質(zhì)量且安全的訓(xùn)練數(shù)據(jù)集。在互動(dòng)過(guò)程中,區(qū)域國(guó)別學(xué)不僅可為主權(quán)級(jí)大模型訓(xùn)練提供數(shù)據(jù)支撐,更可將該學(xué)科的分析邏輯、推理框架等一并輸入,使大模型形成對(duì)齊國(guó)家立場(chǎng)的本地標(biāo)準(zhǔn)與分析體系。









