文本-圖像人工智能系統(tǒng)目前在能力和受歡迎程度上都在蓬勃發(fā)展,還有什么比它們出現(xiàn)在世界最熱門(mén)的應(yīng)用程序中更好的證明?那就是TikTok。這個(gè)視頻平臺(tái)最近增加了一種新的效果,它稱之為"人工智能綠屏",允許用戶輸入文字提示,然后軟件會(huì)生成一個(gè)圖像。這張圖片隨后可以作為視頻的背景--對(duì)創(chuàng)作者來(lái)說(shuō)可能是一個(gè)非常有用的工具。

與Google的Imagen、OpenAI的DALL-E 2或Midjourney的同名軟件等最先進(jìn)的文本到圖像模型相比,TikTok系統(tǒng)的輸出相當(dāng)基本。它只創(chuàng)建了相當(dāng)抽象的圖像;TikTok建議的提示如"海洋中的宇航員"和"鮮花星系"的案例就反映了這一做法。相比之下,其他模型既能產(chǎn)生逼真的圖像,也能產(chǎn)生復(fù)雜而連貫的插圖,看起來(lái)像是人類繪制或畫(huà)的。

不過(guò),TikTok模型的局限性很可能是故意的。首先,更先進(jìn)的模型需要更強(qiáng)的計(jì)算能力,對(duì)該公司來(lái)說(shuō),這將是昂貴和資源密集型的實(shí)施。其次,TikTok有超過(guò)10億的用戶,讓所有這些人有能力創(chuàng)造他們能想象的任何東西的逼真圖像,幾乎能夠肯定又會(huì)讓一些人產(chǎn)生一些不安的想法。
在媒體測(cè)試其模型創(chuàng)造裸體和血腥的能力時(shí),文本到圖像生成器往往會(huì)對(duì)這兩種來(lái)自用戶的意圖施加限制。該模型輸出的抽象性質(zhì)意味著帶有挑釁性語(yǔ)言的提示只能產(chǎn)生一些無(wú)意義的漩渦。
同樣,涉及裸體的要求只產(chǎn)生了一些合適的顏色,但不會(huì)有什么讓人臉紅的內(nèi)容出現(xiàn)。
TikTok的"人工智能綠屏"的出現(xiàn)值得注意的是,它顯示了這項(xiàng)技術(shù)進(jìn)入主流的速度正不斷提升。文本到圖像的人工智能的最新發(fā)展周期可以說(shuō)始于2021年,OpenAI最初發(fā)布了DALL-E。不到兩年后,這項(xiàng)技術(shù)已經(jīng)通過(guò)TikTok這樣的應(yīng)用程序進(jìn)入了數(shù)百萬(wàn)人的手中。

