愛瑪電動車打開出現e4怎么回事、愛瑪電動車打開出現e4怎么回事兒
編輯:Aeneas 好困
最近,Stable Diffusion正在網上大火,誰用誰是藝術家。
作為一種從文本到圖像的AI工具,它之所以能掀起這么大的波瀾,是因為它能夠從簡單的文本提示生成著名人物的逼真圖像。
與傳統的競爭對手Dall-E2相比,Stable Diffusion把生成圖像的速度提高了足足三倍。
論文地址:https://arxiv.org/abs/2112.10752
哈利·波特變權游
讓我們看一看,用Stable Diffusion把《哈利·波特》中的角色變成《權力的游戲》中的角色,是什么效果吧。
艾瑪·沃特森(赫敏·格蘭杰)
赫敏格蘭杰進入權游的世界后,挺像丹妮莉絲·坦格利安的。
評論:可塑性很強的演員,非常適合《權力的游戲》系列。
丹尼爾·雷德克里夫(哈利·波特)
他看起來像瓊恩·雪諾嗎?好像并不太像。
非要說的話,可能更像山姆威爾·塔利一些。
魯珀特·格林特(羅恩·韋斯萊)
不知道為什么,羅恩在照片中會這么顯小。
乍一看,他看起來像拉姆齊·博爾頓(剝皮警告)。但他的形象一點都不像一個能在權力的游戲中呼風喚雨、指揮部下的人。
拉爾夫·費恩(伏地魔)
伏地魔變身維斯特洛武士后,還挺像模像樣的。奇妙的是,他與Night King也很適配。
邁克爾·剛本(阿不思·鄧布利多)
誰會想到,霍格沃茨的校長進入權游后,簡直就像是從這里土生土長的角色。他看起來像是洋蔥騎士(Davos Seaworth)和沃爾德·弗雷(Walder Frey)的結合。
那么, 這個神奇的模型,究竟是怎么做到的呢?
10步帶你理解Stable Diffusion
顧名思義,Stable Diffusion基于的是擴散模型(Diffusion Model)。
其中,擴散是將小的、隨機的噪聲重復地添加到圖像中的過程(從左到右)。而擴散模型是將這一過程逆轉,將噪聲逐位變成圖像(從右到左)。
那么,擴散模型是如何將噪音變成圖像的呢?很簡單,訓練一個神經網絡即可。
現在有噪聲圖像的序列=x_1, x_2, ... x_T。神經網絡通過學習一個函數f(x,t),對x進行「一點點」去噪,并產生x在時間步驟t-1時的樣子。
要想把純噪音變成高清圖像,只需多次應用f即可!
所以說,擴散模型的輸出實際上只是:f(f(f(....f(N, T), T-1), T-2) ..., 2, 1)。
其中,N是純噪音,T是擴散步驟的數量,神經網絡f則通常被實現為一個UNet。
實踐上,在大型512 x 512圖像上訓練和計算擴散模型是非常緩慢和昂貴的。
所以,Stable Diffusion是在圖像的_embedding_上進行計算的,而不是直接在圖像本身上。
因此,Stable Diffusion的工作分為兩步。
第一步:使用編碼器將圖像「x」壓縮成一個較低維度的潛空表征「z(x)」;
第二步:在z(x)上運行擴散和去噪,而不是x。
潛在空間表示z(x)的維度比圖像x小得多。這使得_latent_擴散模型比普通擴散模型更快、更有表現力。
文字提示在哪里呢?
其實,Stable Diffusion并沒有像最開始所說的那樣學習一個函數f(x,t)來對x進行「一點點」的去噪。而是學習了一個函數f(x,t,y),其中y是指導x去噪的context(上下文)。
比如,在下面這張圖中,y就是圖像的標簽「北極狐」。
當使用Stable Diffusion生成圖像時,輸入的文本提示就是y。
那么,模型又是如何處理上下文y的呢?
y和時間步長t一起,可以通過以下兩種方式注入潛在空間表示z(x)中:
1)簡單串聯
2)交叉注意
而Stable Diffusion則同時使用這兩種方法。
當然,上下文機制實際是非常靈活的。
比如讓y=一個圖像掩碼,或者y=一個場景分割,而不只是讓y=一個圖像標簽。
經過在不同的數據上訓練的Stable Diffusion,就可以做圖像修復和語義圖像合成了 。
(示意圖)
在Stable Diffusion論文中,通過改變「上下文」的表征方法,作者展示了圖像修復和圖像合成的情況。
看到這里,是不是感覺手癢了?
模型完全公開了!
你說巧不巧,8月22日團隊發文表示,1.4版本的Stable Diffusion模型正式向大眾開放。
團隊表示,v1.4的推薦權重是470k,比提供給研究人員的v1.3的440k,多了幾個訓練步驟。
目前,模型僅支持英偉達顯卡,最終占用的顯存為6.9Gb。
在接下來的時間里,團隊還將持續發布模型的優化版本,以及更多性能和質量得到改善的變體和架構。
之后,Stable Diffusion模型也將能夠在AMD、蘋果M1/M2和其他芯片組上運行。
不想自己去調教的話,也可以嘗試HuggingFace的demo。
地址:https://huggingface.co/spaces/stabilityai/stable-diffusion
參考資料:
https://medium.com/mlearning-ai/ai-transforms-five-harry-potter-cast-into-game-of-thrones-characters-39e4af6b426e
https://stability.ai/blog/stable-diffusion-public-release