專(zhuān)家解讀 | 任奎:深化推進(jìn)生成式人工智能服務(wù)安全治理
當(dāng)前,以生成式人工智能為代表的人工智能技術(shù)進(jìn)入發(fā)展的快車(chē)道,對(duì)全球經(jīng)濟(jì)社會(huì)發(fā)展和人類(lèi)文明進(jìn)步產(chǎn)生了深遠(yuǎn)影響。與此同時(shí),國(guó)內(nèi)外的生成式人工智能服務(wù)生態(tài)正處于飛躍發(fā)展時(shí)期,其便捷的使用方式、多樣的應(yīng)用場(chǎng)景和高質(zhì)量的生成內(nèi)容,吸引了全球眾多用戶,激發(fā)了人類(lèi)內(nèi)容創(chuàng)作的潛能,釋放了人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展活力。然而,世界各國(guó)對(duì)于生成式人工智能服務(wù)仍缺乏明確具體的管理實(shí)施規(guī)范,難以有效應(yīng)對(duì)生成式人工智能帶來(lái)的各種風(fēng)險(xiǎn)和復(fù)雜挑戰(zhàn)。2023年7月,國(guó)家網(wǎng)信辦等七部門(mén)聯(lián)合發(fā)布了《生成式人工智能服務(wù)管理暫行辦法》(以下簡(jiǎn)稱(chēng)《辦法》),是全球最早全面監(jiān)管生成式人工智能的政策文件。為指導(dǎo)生成式人工智能服務(wù)提供者及相關(guān)主管部門(mén)落實(shí)《辦法》要求,全國(guó)網(wǎng)絡(luò)安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)發(fā)布《生成式人工智能服務(wù)安全基本要求》(以下簡(jiǎn)稱(chēng)《要求》),為推動(dòng)生成式人工智能向上向善發(fā)展提供了細(xì)致具體的實(shí)施標(biāo)準(zhǔn)。
一、立足現(xiàn)有管理辦法,落實(shí)生成式人工智能服務(wù)安全要求
《要求》作為《辦法》的支撐文件,是我國(guó)首個(gè)專(zhuān)門(mén)面向生成式人工智能服務(wù)提出具體安全要求的規(guī)范性文件?!兑蟆肪o密銜接了現(xiàn)有的相關(guān)法律法規(guī)對(duì)于生成式人工智能發(fā)展的安全要求,為響應(yīng)《辦法》中對(duì)于維護(hù)國(guó)家安全和社會(huì)公共利益,保護(hù)公民、法人和其他組織的合法權(quán)益的要求,提供了切實(shí)可行的實(shí)踐指南?!兑蟆愤M(jìn)一步明確了服務(wù)提供者在語(yǔ)料安全、模型安全、安全措施以及安全評(píng)估等多個(gè)方面需要遵循的基本要求。一方面,這些基本要求不僅涵蓋了當(dāng)前全球主要生成式人工智能服務(wù)暴露出的各類(lèi)安全問(wèn)題,而且是對(duì)《辦法》中關(guān)于服務(wù)提供者以及使用者,應(yīng)當(dāng)遵守法律、行政法規(guī),尊重社會(huì)公德和倫理道德的要求的具體和深化。另一方面,考慮到生成式人工智能逐步應(yīng)用于服務(wù)關(guān)鍵信息基礎(chǔ)設(shè)施的發(fā)展前景下,《要求》前瞻性地提出了對(duì)配套保護(hù)措施,尤其是對(duì)需要重點(diǎn)保障的生成內(nèi)容準(zhǔn)確性與可靠性方面的安全要求。同時(shí),為預(yù)防生成式人工智能服務(wù)被低門(mén)檻濫用,《要求》在個(gè)人信息防護(hù)、未成年人保護(hù)等多個(gè)方面,規(guī)定服務(wù)提供者需要充分論證生成式人工智能服務(wù)的必要性、適用性和安全性。由此可見(jiàn),《要求》的發(fā)布響應(yīng)了《辦法》對(duì)于生成式人工智能發(fā)展和應(yīng)用的總體要求,為未來(lái)生成式人工智能服務(wù)的健康發(fā)展提供了堅(jiān)實(shí)的治理基礎(chǔ)。
二、完整覆蓋服務(wù)流程,明確服務(wù)環(huán)節(jié)安全責(zé)任邊界
《要求》對(duì)包括語(yǔ)料來(lái)源安全、語(yǔ)料內(nèi)容安全、語(yǔ)料標(biāo)注安全、模型安全、安全措施在內(nèi)的多個(gè)支撐生成式人工智能服務(wù)整體安全的重要環(huán)節(jié),劃分了安全責(zé)任邊界,這些要求對(duì)服務(wù)提供者需要履行的責(zé)任和義務(wù)做出了明確的規(guī)范。此外,《要求》從構(gòu)建關(guān)鍵詞庫(kù)、測(cè)試題庫(kù)、服務(wù)安全檢測(cè)模型等多個(gè)方面,提出對(duì)內(nèi)容安全的評(píng)估和管控要求。這些要求不僅能幫助服務(wù)提供者主動(dòng)規(guī)避安全風(fēng)險(xiǎn),同時(shí)也能促進(jìn)服務(wù)使用者建立對(duì)服務(wù)的良好使用習(xí)慣。從實(shí)踐看,《要求》從長(zhǎng)遠(yuǎn)而言幫助人工智能企業(yè)逐步建設(shè)分工明確的安全團(tuán)隊(duì),包括減少模型濫用的安全系統(tǒng)團(tuán)隊(duì)、專(zhuān)注模型價(jià)值觀安全的對(duì)齊團(tuán)隊(duì)、管控模型風(fēng)險(xiǎn)的準(zhǔn)備安全團(tuán)隊(duì)等。綜合來(lái)看,《要求》體現(xiàn)了《辦法》中對(duì)促進(jìn)創(chuàng)新和依法治理相結(jié)合的原則,為引導(dǎo)新技術(shù)和新應(yīng)用的規(guī)范發(fā)展提供了有益的范例。
三、精準(zhǔn)刻畫(huà)安全風(fēng)險(xiǎn),建立多維度測(cè)試評(píng)估量化標(biāo)準(zhǔn)
《要求》將生成式人工智能服務(wù)的安全管理落到實(shí)處,使生成式人工智能服務(wù)的管理工作更加明確、可控、合規(guī)。一是《要求》強(qiáng)調(diào)把控風(fēng)險(xiǎn)來(lái)源,落實(shí)監(jiān)管細(xì)節(jié)。當(dāng)前生成式人工智能模型的訓(xùn)練數(shù)據(jù)來(lái)源復(fù)雜,在海量質(zhì)量參差不齊的網(wǎng)絡(luò)數(shù)據(jù)之外,也有大量人工標(biāo)注數(shù)據(jù)。針對(duì)這類(lèi)語(yǔ)料安全風(fēng)險(xiǎn),《要求》通過(guò)場(chǎng)景拆解分析,劃分了覆蓋涉及語(yǔ)料和生成內(nèi)容的共5類(lèi)31種主要安全風(fēng)險(xiǎn),為生成式人工智能服務(wù)安全制訂了具體的檢測(cè)方法和量化指標(biāo)。二是《要求》充分尊重了當(dāng)前人工智能技術(shù)實(shí)踐的復(fù)雜性,對(duì)不同的語(yǔ)料數(shù)據(jù)來(lái)源、模型應(yīng)用模態(tài)和服務(wù)適用目標(biāo)采取了細(xì)化的標(biāo)準(zhǔn),實(shí)踐了包容審慎、鼓勵(lì)創(chuàng)新的治理策略。三是《要求》堅(jiān)持安全原則,嚴(yán)守社會(huì)紅線?!兑蟆访鞔_針對(duì)危害國(guó)家安全、社會(huì)穩(wěn)定、人民群眾合法權(quán)益的風(fēng)險(xiǎn)劃定了紅線,給出了安全實(shí)踐方法,以安全基線保障人工智能更加穩(wěn)定有序發(fā)展。
四、面對(duì)全新安全挑戰(zhàn),貢獻(xiàn)人工智能治理中國(guó)方案
人工智能安全治理議題在全球受到高度重視,許多國(guó)家已經(jīng)相繼出臺(tái)相關(guān)法律法規(guī),但均亟需人工智能的安全治理標(biāo)準(zhǔn)工作予以支撐?!兑蟆肥俏覈?guó)在以標(biāo)準(zhǔn)支撐法律法規(guī),體現(xiàn)人工智能治理精神的良好案例,為全球人工智能治理貢獻(xiàn)了經(jīng)驗(yàn)和智慧,為各國(guó)、各地區(qū)開(kāi)展類(lèi)似工作提供了重要參考。《要求》發(fā)布后,為進(jìn)一步推進(jìn)我國(guó)生成式人工智能服務(wù)在各關(guān)鍵領(lǐng)域的應(yīng)用轉(zhuǎn)化,建議圍繞標(biāo)準(zhǔn)化工作,大力匯聚相關(guān)服務(wù)提供者的數(shù)據(jù)優(yōu)勢(shì)、主要研究機(jī)構(gòu)的技術(shù)優(yōu)勢(shì),構(gòu)建全面性、代表性、共享性的服務(wù)安全測(cè)試數(shù)據(jù)基礎(chǔ),為服務(wù)提供者提供公平可信的評(píng)估渠道。同時(shí),建議針對(duì)各行業(yè)的代表性場(chǎng)景,建立具有領(lǐng)域通用性、符合我國(guó)制度文化特色的評(píng)估指標(biāo)體系,為我國(guó)生成式人工智能技術(shù)應(yīng)用提供可量化的參考標(biāo)準(zhǔn)。