Stability AI宣布推出Stable Diffusion XL1.0,這是一款文本到圖像的模型,該公司稱之為迄今為止“最先進(jìn)”的版本。除了Stability的API和消費(fèi)者應(yīng)用ClipDrop和DreamStudio之外,Stable Diffusion XL1.0還在GitHub上以開源的形式提供,Stability聲稱,與其前身相比,Stable Diffusion XL1.0提供了“更鮮艷”和“準(zhǔn)確”的顏色,以及更好的對(duì)比度、陰影和光照效果。

在接受TechCrunch采訪時(shí),Stability AI的應(yīng)用機(jī)器學(xué)習(xí)負(fù)責(zé)人Joe Penna指出,Stable Diffusion XL1.0包含了35億個(gè)參數(shù),可以在多種縱橫比下“在幾秒鐘內(nèi)”產(chǎn)生全1兆像素分辨率的圖像。“參數(shù)”是模型從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的部分,基本上定義了模型在一個(gè)問(wèn)題上的技能,在這里就是生成圖像。
上一代Stable Diffusion模型,Stable Diffusion XL0.9,也可以產(chǎn)生更高分辨率的圖像,但需要更多的計(jì)算力。
“Stable Diffusion XL1.0是可定制的,可以針對(duì)概念和風(fēng)格進(jìn)行微調(diào)?!盤enna說(shuō)?!八哺菀资褂茫軌蛲ㄟ^(guò)基本的自然語(yǔ)言處理提示實(shí)現(xiàn)復(fù)雜的設(shè)計(jì)?!?/strong>
Stable Diffusion XL1.0在文本生成方面也有所改進(jìn)。雖然許多最好的文本到圖像模型都難以生成帶有清晰標(biāo)志的圖像,更不用說(shuō)書法或字體了,但Penna說(shuō),Stable Diffusion XL1.0能夠?qū)崿F(xiàn)“先進(jìn)”的文本生成和可讀性。
此外,正如SiliconAngle和VentureBeat報(bào)道的那樣,Stable Diffusion XL1.0還支持修復(fù)(重建圖像缺失的部分)、擴(kuò)展(擴(kuò)展現(xiàn)有圖像)和“圖像到圖像”提示——意味著用戶可以輸入一個(gè)圖像,并添加一些文本提示來(lái)創(chuàng)建更詳細(xì)的變化。而且,該模型能夠理解復(fù)雜的、多部分的、用簡(jiǎn)短提示給出的指令,而之前的Stable Diffusion模型則需要更長(zhǎng)的文本提示。
“我們希望通過(guò)發(fā)布這個(gè)更強(qiáng)大的開源模型,不僅圖像的分辨率會(huì)增加四倍,而且還會(huì)帶來(lái)一些巨大的進(jìn)步,這將極大地惠及所有用戶?!彼a(bǔ)充說(shuō)。
但是與之前版本的Stable Diffusion一樣,該模型也引發(fā)了一些棘手的道德問(wèn)題。
Stable Diffusion XL1.0的開源版本理論上可以被不法分子用來(lái)生成有毒或有害的內(nèi)容,比如未經(jīng)同意的換臉。這在一定程度上反映了用來(lái)訓(xùn)練它的數(shù)據(jù):來(lái)自網(wǎng)絡(luò)的數(shù)百萬(wàn)張圖片。
無(wú)數(shù)教程演示了如何使用Stability AI自己的工具,包括DreamStudio,一個(gè)為Stable Diffusion提供開源前端界面的工具來(lái)創(chuàng)建換臉。還有無(wú)數(shù)其他教程展示了如何微調(diào)基礎(chǔ)的Stable Diffusion模型來(lái)生成色情內(nèi)容。
Penna并沒(méi)有否認(rèn)濫用是可能發(fā)生的——并承認(rèn)該模型也包含了某些偏見(jiàn)。但他補(bǔ)充說(shuō),Stability AI已經(jīng)采取了“額外的步驟”來(lái)減少有害內(nèi)容的生成,通過(guò)過(guò)濾模型的訓(xùn)練數(shù)據(jù)中的“不安全”圖像,發(fā)布與有問(wèn)題的提示相關(guān)的新警告,并盡可能地在工具中屏蔽單個(gè)有問(wèn)題的術(shù)語(yǔ)。
Stable Diffusion XL1.0的訓(xùn)練集還包括了一些藝術(shù)家的作品,這些藝術(shù)家曾經(jīng)抗議過(guò)包括Stability AI在內(nèi)的一些公司使用他們的作品作為生成式人工智能模型的訓(xùn)練數(shù)據(jù)。Stability AI聲稱,它受到了美國(guó)公平使用原則的法律保護(hù)。但這并沒(méi)有阻止一些藝術(shù)家和庫(kù)存照片公司Getty Images提起訴訟,以阻止這種做法。
Stability AI與初創(chuàng)公司Spawning有合作關(guān)系,尊重這些藝術(shù)家的“退出”請(qǐng)求,表示它并沒(méi)有從其訓(xùn)練數(shù)據(jù)集中刪除所有被標(biāo)記的藝術(shù)作品,但它“繼續(xù)考慮藝術(shù)家的要求”。