我,PPT設(shè)計(jì)師,AI讓我欲罷不能后,我閉嘴了

科普中國
公眾科普,科學(xué)傳播。
收藏

2024 年春晚,伴隨著任素汐溫暖繾綣的歌聲,全國人民在觀看了春晚上首支 AI 視頻。“透過窗看一幕童話,枕著光芒的云下,晚風(fēng)輕輕地吹過她的銀發(fā),他笑著等她一起慢慢走回家”,音樂里一對(duì)隨著音樂舞動(dòng)的男女從青年走向暮年。

圖片

2024 年中國中央廣播電視總臺(tái)春節(jié)聯(lián)歡晚會(huì)

鮮有人知的是,這樣感動(dòng)人心的節(jié)目背后,是一個(gè)時(shí)限不到一個(gè)月,且不容出錯(cuò)的高難度委托。

AI 實(shí)現(xiàn)了這一看起來“不可能完成的任務(wù)”。

生成式人工智能技術(shù)的飛躍發(fā)展,使人工智能與人的合作達(dá)到了前所未有的深度和廣度。當(dāng)我們不再只是抽象地談?wù)摽苹秒娪爸械?AI,那么 AI 早就已經(jīng)悄悄開始改變著我們工作和生活了。鑒于此,科普中國推出系列對(duì)談,與業(yè)內(nèi)人士聊聊 AIGC 有關(guān)的一切。

你是否好奇春晚作品《枕著光的她》的 AI 雙人舞是如何實(shí)現(xiàn)的?AI 怎樣賦能設(shè)計(jì)師?這段視頻的幕后創(chuàng)作者、PPT 設(shè)計(jì)師阿文在與我們的對(duì)談中分享了他的經(jīng)驗(yàn)。

他說:第一次用 AI 時(shí),他完全沒有想到會(huì)有今天的光景——“我基本離不開 AI 了”。

以下是與阿文的對(duì)談?wù)怼?br /> 微信圖片_20241018154140.png

圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛

AI 是怎樣成為我工作的一部分的

Q:請(qǐng)阿文先簡單介紹您的工作。

阿文:我的本職工作是一名發(fā)布會(huì)的 PPT 設(shè)計(jì)師,我在北京有一家專門做 PPT 的設(shè)計(jì)工作室。另外我還是一名 AI 藝術(shù)家。

Q:你是從何時(shí)開始關(guān)注 AIGC 的?

阿文: 2022 年 4 月我就開始關(guān)注 AI 了。因?yàn)槲医?jīng)常上微博沖浪,當(dāng)時(shí) 2022 年 4 月一個(gè)叫 Disco Diffusion 的工具在微博上流行,我和我身邊很多藝術(shù)家和好朋友都在使用。

Q:剛開始試用 AIGC 時(shí),你對(duì) AI 繪畫的最大能力是怎么設(shè)想的?

阿文:第一印象肯定是很震撼的,2022 年的時(shí)候誰見過這種敲幾個(gè)字就能生成圖像的工具?所以我非常興奮,但當(dāng)時(shí) AI 生成圖片的質(zhì)量還很一般,不夠高清,等 DALLE-2 出來之后,我才對(duì)這個(gè)工具有了完全不一樣的看法,覺得“它說不定能用在我們的工作中”,但也完全沒有想到會(huì)變成現(xiàn)在這個(gè)樣子——我的日常工作基本離不開 AI 了。至少在靜態(tài)圖像領(lǐng)域,AI 是完全可用的狀態(tài)。

Q:AI 幫助你做了什么事?

阿文:AI 目前起最大作用的是我工作中一個(gè)非常重要的環(huán)節(jié)——找設(shè)計(jì)素材。發(fā)布會(huì)經(jīng)常會(huì)做一些超寬屏的設(shè)計(jì),但圖庫里很少有十幾米長的屏幕需要用到非常高清的大尺寸圖片素材。以往我們花費(fèi)大量人工時(shí)間去合成大尺寸素材,現(xiàn)在只需要告訴 AI,我想要什么尺寸的素材就可以了。

實(shí)際上在我主業(yè)做發(fā)布會(huì) PPT 的工作流里,AI 目前占比并不高,大概 25%~30%。最近,我開始嘗試一些 AI 轉(zhuǎn)繪創(chuàng)作,這里 AI 在整個(gè)工作流中占了 80%~90%。

Q:你的創(chuàng)作思路會(huì)因?yàn)?AI 的加入而改變嗎?

阿文:我好像變懶了。過去一個(gè)創(chuàng)作需求來了后,我會(huì)先自己想一下,現(xiàn)在我可能會(huì)下意識(shí)地先敲幾個(gè)關(guān)鍵詞喂給 AI。相當(dāng)于,我多了一個(gè)超強(qiáng)的助手

Q:從 AI 那里獲得的圖,還需要人工改圖嗎?

阿文:一開始我們還需要把 AI 素材導(dǎo)入 PS 里“縫縫補(bǔ)補(bǔ)”,目前基本上能一次到位,我們幾乎都不改了。

Q:AI 做 PPT 的工具你嘗試過么?

阿文:其實(shí)我們專業(yè)的 PPT 設(shè)計(jì)師不太會(huì)看得上這種工具生成的效果,也用不到。它更像是上班族應(yīng)付領(lǐng)導(dǎo)的工作報(bào)告模版。

Q:什么時(shí)候開始做 AI 轉(zhuǎn)繪?

阿文:年初我和海辛老師接到了一個(gè)來自春晚節(jié)目組的委托,任素汐唱那首《枕著光的她》時(shí),大屏要用一段雙人舞作為背景視頻投射在舞臺(tái)上,想要呈現(xiàn)一對(duì)兒男女隨著音樂跳舞,從青年到老年的情景。因?yàn)橹谱髦芷诜浅6?,不到一個(gè)月,如果用傳統(tǒng)路徑做,無論是對(duì)兩個(gè)舞者做動(dòng)捕掃描還是建模,都需要花費(fèi)大量時(shí)間。當(dāng)時(shí)春晚節(jié)目組想到用 AI 的方式看能否在極短的工期內(nèi)做出“還不錯(cuò)”的效果。最后我們做到了。

Q:具體怎么實(shí)現(xiàn)的?

阿文:執(zhí)行項(xiàng)目過程中,我們遇到了很多挑戰(zhàn)。

比如角色穩(wěn)定性問題。節(jié)目的設(shè)計(jì)是雙人舞三個(gè)階段變裝,包括結(jié)婚、婚后、老年三個(gè)階段。利用 AI 來實(shí)現(xiàn)絲滑的變裝是重要的需求。雙人舞之所以會(huì)難做,是因?yàn)?AI 會(huì)將兩個(gè)角色之間的特征進(jìn)行混淆,所以經(jīng)常會(huì)出現(xiàn)性別交換等問題。我們?cè)嚵撕芏喾椒ǎ詈罄?ControlNet tile 模型固定下來人物的特征,解決了這個(gè)難題。

再比如瓷器材質(zhì)的實(shí)現(xiàn)。我們?cè)?SDXL 和 Civitai 開源模型和 LoRa 的加持下,很快確定選擇了白瓷材質(zhì)的跳舞小人。但中間遇到了很多問題,就在我們以為得訓(xùn)練 SD1.5 的瓷器 LoRa ,我們發(fā)現(xiàn)用一個(gè) “關(guān)鍵詞” 就可以解決材質(zhì)問題。除了關(guān)鍵詞以外,我們還發(fā)現(xiàn)了一個(gè)叫 IP-Adapter 的插件,可以用一張參考圖來引導(dǎo) AI 生成指定材質(zhì)效果。

另一個(gè)難題是換裝穩(wěn)定性測(cè)試,我們首先在 PR 里對(duì)齊了剪輯,在生成時(shí)通過 prompt travel 的方式(不同關(guān)鍵幀描述不同的內(nèi)容)達(dá)到了節(jié)目組滿意的效果。

對(duì)AI的暢想

Q:現(xiàn)在的 AI 生成圖像還有哪些升級(jí)空間呢?

阿文:AI 生成圖像我覺得已經(jīng)到頭了。

Q:已經(jīng)到您想象的邊界了嗎?

阿文:反正你任意把兩張圖片放在我面前,我可能已經(jīng)沒辦法分辨出來哪個(gè)是 AI(生成的)哪個(gè)是真的人創(chuàng)造的。

AI越發(fā)展,我就越分不清,連我們專業(yè)領(lǐng)域的設(shè)計(jì)師都是如此,那對(duì)于大眾來說,AI 圖片的質(zhì)量已經(jīng)完全足夠了,AI 作畫已經(jīng) next level 了。其實(shí)對(duì)于 AI 發(fā)展,最高傲的就是我們這個(gè)群體,一開始我們大部分人瞧不起 AI 生成的圖像。就想“ AI 怎么可能比得上我們親自設(shè)計(jì)或畫出來的東西?”但越到后面就越會(huì)發(fā)現(xiàn) AI 生成質(zhì)量越來越好,當(dāng)我們?cè)嚵艘幌?,簡直“欲罷不能”,而且它確實(shí)讓你的工作量減少,讓你效率變高了。然后我就慢慢閉嘴了。

不過非要說的話,需要跟 ChatGPT 這種文字大模型的能力再結(jié)合一下,讓文生圖模型能更好地理解“人話”。

現(xiàn)在我會(huì)比較多地做 AI 轉(zhuǎn)繪,做出偏油畫風(fēng)的那種風(fēng)格。比如說把上海場(chǎng)街景變成梵高里某幅名畫里的場(chǎng)景。

Q:AI能替代什么工作,以及什么是不能替代的?

阿文:重復(fù)勞動(dòng)的肯定會(huì)被替代。比如你以前的工作每天都在摳圖,每做著跟創(chuàng)意毫無關(guān)系的工作,那你絕對(duì)會(huì)被替代。它替代不了的話肯定是一些比較軟的能力,比如創(chuàng)意。這樣的工種我覺得完全是沒辦法替代的,而且越到后面越拼的就是你個(gè)人的審美,你個(gè)人的內(nèi)容審美或者設(shè)計(jì)審美,都會(huì)影響你最后的圖像作品。而目前AI它只能隨機(jī)帶來一些靈感,但是人類它是可以很主觀地輸出自己的審美,這是不能替代的。

我觀察到一個(gè)比較有意思的現(xiàn)象,兩年前一些外行去挑釁畫師,挑釁那些游戲原畫,挑釁設(shè)計(jì)師,說你們馬上就要失業(yè)了。但是兩年后的今天,你會(huì)發(fā)現(xiàn) OPENART 社區(qū)里前十名的居然大部分是游戲原畫師和設(shè)計(jì)師。AI作畫最后爬向了金字塔頂頂尖,站在頂點(diǎn)的還是那群專業(yè)的人。

Q:你對(duì)AIGC的從業(yè)者有哪些建議?

阿文:不要太有被落下的焦慮。這個(gè)世界上每天每天都有新技術(shù)出現(xiàn),根據(jù)我這大半年的觀察,等大家試用完之后撿漏,測(cè)試那個(gè)效果最好的工具,這樣才是一個(gè)高效的方式。

Q:你覺得AI能創(chuàng)造新職業(yè)嗎?

阿文:肯定會(huì)有的。但是目前來說,用AI比較多的是傳統(tǒng)設(shè)計(jì)師轉(zhuǎn)崗的。

Q:你覺得AI未來的天花板會(huì)是像人一樣嗎?還是說AI會(huì)有另一個(gè)發(fā)展方向?

阿文:我覺得他會(huì)超越人,因?yàn)锳I光是知識(shí)儲(chǔ)備就已經(jīng)遠(yuǎn)超每一個(gè)人類了,甚至它可能是人類知識(shí)的總和。關(guān)鍵就回到了AI怎么去利用知識(shí),我覺得AI超越人類可能只是時(shí)間問題。

Q:可以推薦大家一些您發(fā)現(xiàn)的AIGC有趣玩法嗎?

阿文:我用過最好用的AI翻譯插件是沉浸式翻譯,它能一鍵把所有外語網(wǎng)頁內(nèi)容變成雙語翻譯,而且背后是大語言模型,翻譯特別精準(zhǔn);還推薦所有編程小白試試cursor,零代碼基礎(chǔ)也能寫網(wǎng)站寫應(yīng)用!另外,我還想分享有一個(gè)想深度玩轉(zhuǎn) AIGC 的朋友一款最應(yīng)該入門的AI工具:comfyUI,入門之后,所有開源技術(shù)都是你的插件。

Q:最后你還有什么想分享的么?

阿文:我很想說,其實(shí)中國在 AI 領(lǐng)域的成就非常可怕,十分厲害。全世界范圍內(nèi),媒體們太過渲染國外大公司的模型能力了,忽略了那些低調(diào)卻閃閃發(fā)光的中國團(tuán)隊(duì)。

其實(shí)開源社區(qū)里,至少在 AI 繪畫、AI 視頻領(lǐng)域,有 90% 的組件是華人或者中國團(tuán)隊(duì)寫出來的:LCM、AnimateDiff、instantID、IPadapter、LivePortrait等等等,更別說可靈了。其實(shí)外國開源社區(qū)是對(duì)中國團(tuán)隊(duì)是非常敬畏的,但中國團(tuán)隊(duì)一直很低調(diào),在國內(nèi)很少出圈,所以很多人總覺得中國的 AI 技術(shù)不行,打不過國外,其實(shí)在我看來完全不是!

策劃制作

作者丨凍頂烏龍 科普創(chuàng)作者

受訪對(duì)象丨Simon阿文 AbleSlide 聯(lián)合創(chuàng)始人,AI藝術(shù)家

審核丨于旸 騰訊玄武實(shí)驗(yàn)室負(fù)責(zé)人

策劃丨林林

責(zé)編丨何通

審校丨徐來 林林

評(píng)論
懷念回不去的家
少師級(jí)
雖然AI很強(qiáng)大,但最終的創(chuàng)意和決策還是掌握在設(shè)計(jì)師手中,您的專業(yè)眼光和創(chuàng)造力是制造出色PPT的關(guān)鍵,不要妄自菲薄!
2024-10-18
無為通達(dá)
學(xué)士級(jí)
AIGC在中國的發(fā)展前景廣闊,具有巨大的市場(chǎng)潛力和應(yīng)用價(jià)值。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,AIGC將為人們的生活和工作帶來更多便利和創(chuàng)新。
2024-10-18
無為通達(dá)
學(xué)士級(jí)
AIGC作為人工智能領(lǐng)域的一個(gè)重要分支,具有廣泛的應(yīng)用前景和巨大的發(fā)展?jié)摿ΑkS著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,AIGC將為人們的生活和工作帶來更多便利和創(chuàng)新。
2024-10-18