版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

算法治理第一關(guān):算法備案監(jiān)管現(xiàn)狀與實務(wù)解讀(下)

中啟行
企業(yè)致力于科技新聞媒體及科普教育傳播
收藏

算法治理第一關(guān):算法備案監(jiān)管現(xiàn)狀與實務(wù)解讀(下)

【前言】

隨著算法備案逐步進入合規(guī)視野,許多企業(yè)都面臨著算法備案的合規(guī)需求。但實際上大量企業(yè)尚未著手準備算法備案的相關(guān)程序,一方面是由于關(guān)于算法備案的合規(guī)義務(wù)仍未普及,一部分企業(yè)對于算法備案的認識存在不足或偏差,另一方面,企業(yè)對于算法備案的具體流程難以把控。本文上篇主要解讀了算法備案的整體監(jiān)管狀況、實務(wù)流程,下篇則針對“具有輿論屬性或者社會動員能力”展開分析與探討,從實踐視角展開,以算法備案為抓手,通過對算法備案現(xiàn)狀進行分析、統(tǒng)計,以期為企業(yè)提供算法備案的合規(guī)參考與實務(wù)幫助。

目前,對于算法備案義務(wù)作出明確規(guī)定的規(guī)范性文件主要有《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(以下簡稱《算法推薦規(guī)定》)、《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》(以下簡稱《深度合成規(guī)定》)、以及《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《暫行辦法》),算法備案的義務(wù)主體范圍則界定為“具有輿論屬性或者社會動員能力的算法推薦服務(wù)/深度合成服務(wù)提供者”。

主體范圍:

“具有輿論屬性或者社會動員能力”關(guān)注誰?

這一表述容易使人產(chǎn)生誤解之處在于,“具有輿論屬性或者社會動員能力”究竟形容“算法服務(wù)”還是“算法服務(wù)提供者”?

最新出臺的《暫行辦法》對這一問題作出了相對確切的解答。不同于《生成式人工智能服務(wù)管理辦法(征求意見稿)》中只是要求“利用生成式人工智能產(chǎn)品向公眾提供服務(wù)”的提供者按照相關(guān)條款履行算法備案義務(wù)?!稌盒修k法》進一步明確履行算法備案義務(wù)的主體為“提供具有輿論屬性或者社會動員能力的生成式人工智能服務(wù)的”提供者,也就是說,“具有輿論屬性或者社會動員能力”應(yīng)指向算法服務(wù),而非提供算法服務(wù)的主體。這將在很大程度上為企業(yè)減負,緩解算法備案的壓力。

主體特征:

何為“具有輿論屬性或者社會動員能力”?

(一)現(xiàn)行規(guī)范的模糊性

企業(yè)主要填寫的內(nèi)容包括主體基本信息、證件

在算法備案的主體方面,更重要的問題是如何理解“具有輿論屬性或者社會動員能力”?“具有輿論屬性或者社會動員能力”是判定相關(guān)主體所提供的算法服務(wù)是否需要履行算法備案義務(wù)的一個關(guān)鍵性因素,但其確切含義始終含糊不清。

《算法推薦規(guī)定》《深度合成規(guī)定》均未對此有所界定,2018年11月30日施行的《具有輿論屬性或社會動員能力的互聯(lián)網(wǎng)信息服務(wù)安全評估規(guī)定》第二條則規(guī)定,“具有輿論屬性或社會動員能力”的互聯(lián)網(wǎng)信息服務(wù)包括以下情形:

(一)開辦論壇、博客、微博客、聊天室、通訊群組、公眾賬號、短視頻、網(wǎng)絡(luò)直播、信息分享、小程序等信息服務(wù)或者附設(shè)相應(yīng)功能;

(二)開辦提供公眾輿論表達渠道或者具有發(fā)動社會公眾從事特定活動能力的其他互聯(lián)網(wǎng)信息服務(wù)。

由于法律規(guī)范存在較大的可解釋空間,我們不妨把視角轉(zhuǎn)向算法備案實踐,對目前已經(jīng)完成算法備案的算法進行統(tǒng)計分析,盡可能找出各算法類型的共通性,希望能夠為面臨算法備案問題的企業(yè)提供幫助。

(二)算法備案實踐統(tǒng)計

1. 總體概況

對目前已完成備案的算法進行數(shù)據(jù)統(tǒng)計后,我們認為在算法備案中,“具有輿論屬性或者社會動員能力”的認定范圍極其廣泛,具體而言,如果企業(yè)提供的算法最終面向的服務(wù)對象為社會公眾,則該算法便會被認定為“具有輿論屬性或者社會動員能力”,企業(yè)需要承擔算法備案義務(wù)以滿足合規(guī)要求。針對算法備案中的個性化推送類、深度合成類等典型算法類型,我們根據(jù)算法備案現(xiàn)狀,從中抽象出各個類型算法的常見應(yīng)用、典型適用場景、常用技術(shù)、算法運行邏輯等內(nèi)容,為企業(yè)提供參考。

目前,算法備案主要適用于算法推薦技術(shù)與深度合成技術(shù),其中,算法推薦技術(shù)已經(jīng)有四批、262個算法完成備案程序,深度合成技術(shù)則是在6月完成第一批、41個算法的備案程序。具體的數(shù)據(jù)統(tǒng)計如下表(表一、二)所示。

如圖一所示,針對算法推薦類服務(wù),我們統(tǒng)計了個性化推送類、檢索過濾類、排序精選類、以及調(diào)度決策類的數(shù)量與占比,在《深度合成規(guī)定》生效以后,生成合成類與深度合成類算法歸并,因此,生成合成類一并納入深度合成類算法進行統(tǒng)計。

對于深度合成類算法,《深度合成規(guī)定》中則列舉了六種典型的深度合成技術(shù)類型:

? 篇章生成、文本風格轉(zhuǎn)換、問答對話等生成或者編輯文本內(nèi)容的技術(shù);

? 文本轉(zhuǎn)語音、語音轉(zhuǎn)換、語音屬性編輯等生成或者編輯語音內(nèi)容的技術(shù);

? 音樂生成、場景聲編輯等生成或者編輯非語音內(nèi)容的技術(shù);

? 人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態(tài)操控等生成或者編輯圖像、視 頻內(nèi)容中生物特征的技術(shù);

? 圖像生成、圖像增強、圖像修復(fù)等生成或者編輯圖像、視頻內(nèi)容中非生物特征的技術(shù);

? 三維重建、數(shù)字仿真等生成或者編輯數(shù)字人物、虛擬場景的技術(shù)。

我們根據(jù)理解將已經(jīng)完成備案的深度合成類算法按上述六類進行歸類統(tǒng)計,如圖二所示。其中,有多個算法的生成結(jié)果包含文本、語音內(nèi)容、圖片等多種形式,占深度合成類算法總備案數(shù)的17%,此類包含多種形式的內(nèi)容生成、編輯技術(shù)的模型多應(yīng)用于智能客服場景、多視頻制作場景等。例如,在智能客服場景下,算法運行的大模型能夠根據(jù)用戶咨詢內(nèi)容,生成文本或語音智能回答。

2. 個性化推送類算法

個性化推薦類算法的主要功能在于通過對用戶興趣和需求進行分析和預(yù)測,為用戶提供個性化的商品或服務(wù)推薦。在已完成備案的算法推薦服務(wù)類別中,合計136個算法均為個性化推送類,占比54%,如表三所示,本文將列舉十個涉及不同行業(yè)領(lǐng)域的典型示例以供參考。

通過對收集淘寶、美團、微信等企業(yè)公示的算法備案信息進行分析,此類算法的適用場景多為內(nèi)容推薦,基于用戶的歷史行為、用戶基礎(chǔ)信息、設(shè)備服務(wù)日志等相關(guān)數(shù)據(jù),通過內(nèi)容標簽系統(tǒng)、用戶畫像系統(tǒng)、以及推薦引擎等系統(tǒng),使用召回、過濾、排序等一系列的技術(shù)手段,最終為用戶提供其可能感興趣的信息。

3. 檢索過濾類算法

檢索過濾類算法的典型適用場景為搜索推薦和內(nèi)容審查兩種,該算法通過一系列技術(shù)手段,對內(nèi)容進行檢索、過濾,實現(xiàn)內(nèi)容安全的風險識別,或滿足用戶搜索需求。具體示例如表四所示。

在搜索推薦場景下,算法運行邏輯通常為:

(1)對搜索詞進行分詞與意圖識別;

(2)基于用戶在功能界面所選擇的內(nèi)容標簽、內(nèi)容畫像以及用戶自身在平臺內(nèi)的行為畫像,匹配符合要求的搜索結(jié)果;

(3)去除部分無需推薦的內(nèi)容,減少排序模型壓力,完成過濾步驟;

(4)按照算法模型計算內(nèi)容得分,通過排序機制優(yōu)化用戶使用體驗;

(5)在排序過程中引入多樣性打散機制,拓展展示內(nèi)容,避免同類型內(nèi)容過度集中。

內(nèi)容安全風險識別場景下,算法則通過深度學(xué)習等風險分類模型對平臺上文本、圖片、音頻、視頻等信息進行安全風險識別,形成不同的風險置信度等級,對于高置信度的信息通常由算法直接完成審核,對于低置信度的信息則將引入人工審核,最后完成對違規(guī)信息的處置決策。

4. 排序精選類算法

排序精選類算法通過特定的算法因式將數(shù)據(jù)按照既定的模式或規(guī)則進行重新排序,在用戶訪問產(chǎn)品內(nèi)相應(yīng)功能界面時,算法首先根據(jù)用戶在功能界面所選擇的內(nèi)容標簽,匹配符合要求的內(nèi)容;其次以用戶的點擊率/閱讀率/閱讀時長等作為優(yōu)化目標,使用統(tǒng)計口徑計算內(nèi)容得分;最終,根據(jù)運營或者策略需求,通過重排機制調(diào)整結(jié)果列表的順序,并最終以排行榜等形式向用戶呈現(xiàn)各類清單。具體示例如表五所示。

5. 調(diào)度決策類算法

目前,調(diào)度決策類已經(jīng)完成算法備案的較少,共計由5家企業(yè)為7個算法完成備案手續(xù),具體如下表六所示。此類算法所適用的典型場景為派單與配送兩種,通過智能調(diào)度模型、配送市場預(yù)估模型,在外賣、快遞的配送,網(wǎng)約車的派單等情境中實現(xiàn)效率提高。

6. 深度合成類(生成合成類)

深度合成類算法的應(yīng)用場景更為多元化,在不同的應(yīng)用場景中,各類APP運用前述不同種類的深度合成技術(shù)為其功能實現(xiàn)賦能,以滿足用戶需求。如下表所示,我們選取了十類典型場景,通過應(yīng)用場景、適用APP、使用技術(shù)、以及主要功能的一一對應(yīng),為提供類似產(chǎn)品、服務(wù)的企業(yè)提供參照。

算法的應(yīng)用在給經(jīng)濟、社會發(fā)展注入新動能的同時,其不合理應(yīng)用所導(dǎo)致的算法歧視等問題也深刻影響著正常的傳播秩序、市場秩序和社會秩序,給維護意識形態(tài)安全、社會公平公正和網(wǎng)民合法權(quán)益帶來挑戰(zhàn)?;ヂ?lián)網(wǎng)信息服務(wù)領(lǐng)域出臺的具有針對性的算法備案等規(guī)范性制度,是互聯(lián)網(wǎng)關(guān)聯(lián)企業(yè)在當前的發(fā)展環(huán)境下所不能忽略的合規(guī)焦點。切實履行合規(guī)義務(wù),方為企業(yè)健康發(fā)展的基石。

作者:王渝偉 陸釔潼