上傳一張照片,就可以擁有自己的動漫形象?
現(xiàn)在一個名為 “Toonify yourself”的 AI 工具就可以辦到,而且效果非常逼真。
秒變“迪士尼在逃公主”,這款一鍵切換“漫畫臉”AI,因效果太過逼真徹底火了!
最近,熱映的真人版《花木蘭》,在國外又掀起了一股動漫風(fēng)!各種名人漫畫形象頻頻刷屏,比如這張宮崎駿老爺爺,可可愛愛的形象完全可以出演動漫電影了。
還有這張演員楊紫瓊的動漫形象,大眼、瘦臉完全具備了動漫角色的典型特征。
更重要的是幾乎復(fù)刻了真人的原始狀態(tài),包括頭發(fā)、面部表情、神態(tài),妥妥地定制化動漫形象。
這些動漫形象全部出自一個名為 “Toonify yourself”的 AI 工具。它不僅呈現(xiàn)出效果逼真,操作起來還非常簡單,只需在模型中上傳一張照片即可!
據(jù)了解,這款工具剛剛發(fā)布就完成了 25 萬次服務(wù),非常受用戶歡迎,還有網(wǎng)友評論稱:研發(fā)者可以考慮考慮商業(yè)化的問題了。
那么,這款工具是如何實現(xiàn)的呢?
生成漫畫臉的技術(shù)原理
據(jù)它的創(chuàng)建者之一 Doron Adler 介紹稱,該工具主要利用了混合網(wǎng)絡(luò)(Blended Network),這是一個復(fù)雜的網(wǎng)絡(luò)機制,主要由于兩部分模型來完成:StyleGAN Model 和 Blended Model。
其中,StyleGAN Model 負(fù)責(zé)對初始照片進(jìn)行預(yù)訓(xùn)練,其目的是節(jié)省訓(xùn)練的時間和成本,因為對于個人而言,并不是每個人都有足夠的 CPU 或者數(shù)周的時間進(jìn)行數(shù)據(jù)訓(xùn)練,這個過程也被成為 “轉(zhuǎn)移學(xué)習(xí)(Transfer learning)“。
重要的是,通過預(yù)訓(xùn)練模型,可以得到更高質(zhì)量的圖像。
Doron 介紹稱,為了達(dá)到更好的動漫效果,他們收集了迪士尼 / 皮克斯 / 夢工廠等大約 300 張動漫圖像作為數(shù)據(jù)集。
通過對數(shù)據(jù)集進(jìn)行訓(xùn)練來學(xué)習(xí)動漫角色的典型特征。從以下輸出結(jié)果來看,效果還是非常不錯的。
盡管對數(shù)據(jù)集進(jìn)行了少量的訓(xùn)練,但大眼、瘦臉等典型特征都能很好的捕捉到。其中部分圖像比較模糊,是因為原始圖像的分辨率比較低,而且有些是手繪圖像造成的。
接下來,經(jīng)過人臉微調(diào)的圖像會進(jìn)入 Blend Model 的處理階段。
在這里,由于 StyleGAN 的結(jié)構(gòu),模型中的不同層以不同的方式影響生成人物的外觀。低分辨率層決定頭部姿態(tài)和人臉形狀,高分辨率層則控制光線和紋理等細(xì)節(jié)。
Doron 使用的 Layer Swapping 腳本從原始模型中提取了高分辨率層,從 StyleGAN Model 微調(diào)模型中提取低分辨率層,因此,最終得到了具有卡通人臉結(jié)構(gòu)且具備照片級逼真渲染效果的混合模型。
可以看到,使用原始的面孔模型和混合卡通模型生成圖像,兩者之間存在著明顯的聯(lián)系,保持了人物的原始面貌,同時也實現(xiàn)了動漫化。(需要強調(diào)的是,如果需要高分辨率的卡通形象,則需要輸入高像素的原始圖像,一般不得低于 1024x1024 像素)。
效果逼真,操作簡單,但因太火而下線
StyleGAN 模型可以產(chǎn)生大量人臉圖像,在其中可以找到任何一張人臉的圖像。比如通過該模型輸入一張需要處理的圖像示例,模型會通過 “代碼”(也稱為潛在向量),輸出一個與示例完全匹配的人臉圖像,如下圖左邊為原圖在左邊,右邊邊為生成圖。
然后將具有特定 “代碼”的人臉圖像輸入混合模型,結(jié)果就可以得到一個卡通化人臉。
這一過程,輸入示例大致經(jīng)歷了三步處理過程:
提取面步特征,并自動對齊圖像。
找到潛在代碼,復(fù)制圖像。
使用卡通模型的潛在代碼 , 對圖像進(jìn)行處理。
基于這一原理,用戶只需要在系統(tǒng)中上傳照片即可。不過可惜的是,由于用戶訪問量過大,考慮到服務(wù)器的運行成本,Doron 暫時關(guān)閉了這一系統(tǒng)的使用入口,并表示重新規(guī)劃成本效益后,會再次對外開放。
關(guān)于作者
Justin Pinkney 是該工具另一創(chuàng)建者。與 Doron 一樣,Justin 對生成藝術(shù)和機器學(xué)習(xí)非常感興趣。
從他的個人主頁上了解到,Justin 曾是一名物理學(xué)家,現(xiàn)在英國 MathWorks 擔(dān)任軟件顧問,負(fù)責(zé)算法開發(fā)、模型訓(xùn)練以及組織軟件開發(fā)實踐。
Justin 利用 StyleGAN 模型做過多項研究。比如他通過 StyleGAN Network Blend 讓壁畫上的浮雕秒變?nèi)四槇D像。
該項研究同樣是基于 “圖層交換(Layer Swapping)”的概念,將基礎(chǔ)模型與使用轉(zhuǎn)移學(xué)習(xí)的模型(即微調(diào)模型)融合在一起達(dá)到最終的效果。
此外,還有利用神經(jīng)網(wǎng)絡(luò)生成各類虛假蛋糕等。
關(guān)鍵詞: