目前 AI 作畫如果想要發(fā)展壯大,還存在一個(gè)致命的潛在問題, AI 產(chǎn)生的作品版權(quán)到底是誰的?我們回顧一下 AI 創(chuàng)作的過程。首先,人工智能領(lǐng)域的開發(fā)者會(huì)使用大量由人類創(chuàng)作的同類作品,訓(xùn)練出一個(gè)人工智能模型。在開放模型接口后,任何人都可以輸入一些文字提示,讓模型生成出獨(dú)特的作品。我們可以把這一過程分成兩部分,人工智能模型的開發(fā)者要和用戶解決版權(quán)問題,同時(shí)也要和他們拿來訓(xùn)練模型的數(shù)據(jù)作者,解決數(shù)據(jù)使用權(quán)的問題。
圖片來源:pixabay
AI版權(quán)備受爭(zhēng)議
對(duì)于第一個(gè)問題,美國(guó)和歐洲此前的判例都強(qiáng)調(diào),作品的著作權(quán)必須屬于人。一個(gè)例子是,藝術(shù)家 Kristina Kashtanova 在 AI 的協(xié)助下創(chuàng)作了漫畫黎明查利亞,并成功注冊(cè)了著作權(quán),被廣泛傳頌為首個(gè)獲得著作權(quán)的人工智能作品。但隨后美國(guó)版權(quán)局取消了注冊(cè)要求。 Kashtanova 必須提供創(chuàng)作過程細(xì)節(jié),用來證明這部作品的創(chuàng)作有大量的人為參與。
那么,能否退一步,將所有人工智能的作品的版權(quán)授予開發(fā)人工智能模型的人,然后再讓他們與模型的使用者達(dá)成協(xié)議?傳統(tǒng)的法律并不支持這一點(diǎn),這是因?yàn)閭鹘y(tǒng)意義上能產(chǎn)生作品的計(jì)算機(jī)程序?qū)ψ髌返呢暙I(xiàn)非常有限。一個(gè)經(jīng)常被使用的例子是,鋼筆制造商或開發(fā) Microsoft word 的程序員不可能和作家們分享文學(xué)作品的知識(shí)產(chǎn)權(quán),但人工智能獨(dú)立工作的能力要強(qiáng)大得多,似乎自己就能完成獨(dú)立的創(chuàng)意和相對(duì)完整的作品。這種情況下,計(jì)算機(jī)作為創(chuàng)作者的角色也許需要被重新考慮。
另一方面,如果一些人只需要修改別人訓(xùn)練好的模型,就得到自己想要的文字產(chǎn)品或藝術(shù)作品,他們是否也屬于創(chuàng)作者?在參與方如此之多的情況下,如何認(rèn)定侵權(quán)責(zé)任也成了難題。在自己為自己負(fù)責(zé)的生產(chǎn)方式中,生產(chǎn)者如果沒有主觀抄襲的意愿,侵權(quán)的可能性相對(duì)較低。但如果使用人工智能模型生成作品,終端使用者就很難把控。如果他們花了一小筆費(fèi)用買了自己生成作品的著作權(quán),但這個(gè)作品卻被發(fā)現(xiàn)和某個(gè)人類作品極為相似。這個(gè)終端用戶是否應(yīng)該承擔(dān)侵權(quán)責(zé)任?
假如一張?jiān)谑袌?chǎng)上流通的圖片被判定侵權(quán),使用模型的普通用戶,模型的設(shè)計(jì)者,修改模型的第三方開發(fā)者,誰應(yīng)該承擔(dān)責(zé)任?這似乎很難判定。人工智能開發(fā)者和他們用來訓(xùn)練模型的作品的作者之間的爭(zhēng)議就更加尖銳了,因?yàn)槟壳耙呀?jīng)產(chǎn)生了法律訴訟。傳統(tǒng)上,圖片、文字和代碼的內(nèi)容,作者們很可能會(huì)通過一個(gè)授權(quán)協(xié)議,讓大家免費(fèi)使用他們的作品。這些授權(quán)協(xié)議有的時(shí)候會(huì)要求使用者不能商用他們的作品,有的時(shí)候允許商業(yè)使用,但必須完整地保留署名。
然而,人工智能模型和訓(xùn)練這些模型的機(jī)構(gòu)卻很難在內(nèi)容生產(chǎn)鏈條上被歸入任何傳統(tǒng)的角色類型。模型生成的圖片不會(huì)也不可能給所有訓(xùn)練數(shù)據(jù)的作者署名,但這些圖片也確實(shí)和原始圖片存在差異。在這種情況下,如何平衡各方的利益,保障創(chuàng)作者、用戶和 AI 開發(fā)者的合法權(quán)益成為了一個(gè)亟待解決的問題。
風(fēng)格版權(quán)的藝術(shù)家們
如果把機(jī)器學(xué)習(xí)模型的訓(xùn)練過程類比于人類的學(xué)習(xí),似乎沒有任何理由禁止繪畫的初學(xué)者學(xué)習(xí)和臨摹自己的作品。深度學(xué)習(xí)的奠基者之一、圖靈獎(jiǎng)得主 Yann LeCun 也表示,如果要獲得許可才能從其他藝術(shù)家那里收獲靈感和啟發(fā),藝術(shù)創(chuàng)作就要死亡。 AI 模型開發(fā)者是否也有充足的理由聲稱自己的模型只是在學(xué)習(xí)已有作品的風(fēng)格,這和人類的學(xué)習(xí)方式?jīng)]有本質(zhì)的區(qū)別,所以不構(gòu)成侵權(quán)。當(dāng)然,不是所有的藝術(shù)家都認(rèn)同這一邏輯,波蘭插畫家 Greg Rutkowski 就是如此。一天, Rutkowski 在搜索自己的名字時(shí),發(fā)現(xiàn)大部分和他名字關(guān)聯(lián)的圖片都不是他的作品,而是模型用戶用他的名字生成的人工智能圖片。原來, Stable Diffusion 允許用戶生成類似他的風(fēng)格的畫作。當(dāng)藝術(shù)家在分享網(wǎng)站上傳作品的時(shí)候,為優(yōu)化搜索和方便視障人士等原因,也會(huì)提供圖片的文字描述,因此也就成為了完美的圖片生成訓(xùn)練數(shù)據(jù)。
谷歌的 Stable Diffusion 就大量使用了 StationArt 和 Printereast 等藝術(shù)設(shè)計(jì)分享網(wǎng)站上的圖片,其中就包括了 Greg Rutkosky 的作品。事實(shí)上,專門為奇幻游戲繪畫的 Rutkowski 有著鮮明的風(fēng)格,因此廣受歡迎,用戶對(duì)它的興趣遠(yuǎn)遠(yuǎn)超過了畢加索和達(dá)芬奇等著名畫家,他們生成圖片后就會(huì)分享到網(wǎng)上,瞬間擁有了 Rutkowski 自己真實(shí)的畫作。
2022 年 11 月,一群程序員起訴了微軟和OpenAI,他們的訴訟已提交到美國(guó)加州北區(qū)地方法院,要求法院批準(zhǔn) 90 億美元的賠償金。這是因?yàn)槲④浧煜碌拇a倉(cāng)庫 GitHub 和 OpenAI 聯(lián)合推出了代碼自動(dòng)生成的模型Copilot。這個(gè)模型通過 GitHub 上 5000 多萬個(gè)代碼庫里的代碼訓(xùn)練而成,而這些代碼的作者認(rèn)為, GitHub 和 OpenAI 未經(jīng)允許就使用了他們的代碼。他們認(rèn)為,雖然目前 AI 系統(tǒng)不受法律約束,但創(chuàng)建和運(yùn)營(yíng)這些系統(tǒng)的主體必須承擔(dān)責(zé)任。這很有可能是美國(guó)史上第一個(gè)針對(duì) AI 生成模型的集體訴訟案,但肯定不會(huì)是最后一次。
雖然在目前的公眾認(rèn)知中,大家普遍認(rèn)為人工智能公司在強(qiáng)大的技術(shù)資本的支持下,赤裸裸地侵犯了可憐而清貧的藝術(shù)家們,但這些公司也代表了技術(shù)創(chuàng)新的力量。對(duì)政策制定者而言,知識(shí)產(chǎn)權(quán)不僅僅要用來保護(hù)畫家、作家這樣的創(chuàng)造者,也要支持資本繼續(xù)投資技術(shù)研發(fā),讓他們也獲得合理的回報(bào)?,F(xiàn)在看來,這是一種非常困難的平衡,也沒有現(xiàn)成的解決方案。也許只有等到更多的模型和人類的合作和摩擦的案例產(chǎn)生,才能出現(xiàn)完整而合理的判決案例。
文章由科普中國(guó)-星空計(jì)劃(創(chuàng)作培育)出品,轉(zhuǎn)載請(qǐng)注明來源。
作者:管心宇 科普作者
審核:于旸 騰訊玄武實(shí)驗(yàn)室負(fù)責(zé)人