污黄成人网站 入口在线观看_日本中文字幕不卡_日韩欧美一区二区在线观看_亚洲AV无码AV日韩AV网站_91热久久免费频精品18韩国

 

奧丁科技為元宇宙“造智慧人”|虛實之間

發(fā)布時間:2022-03-28 10:41:04  |  來源:騰訊網(wǎng)  

奧丁科技希望基于自研的硬件、軟件、算法和AI等綜合能力,讓數(shù)字人更加逼真和智能,并通過仿生學和人類學研究不斷降低成本,增加產(chǎn)能,完成超寫實數(shù)字人的普及。

作者|黃澤正

這是新聲Pro「虛實之間」系列文章第8篇

在當前大熱的元宇宙話題下,數(shù)字人似乎也成為了焦點。究其原因,在過往的PC互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)時代,主要的信息載體是圖片、文字,因此交互方式以電腦鼠標和手機觸屏為主,但這種交互方式與人真實的交互習慣相去甚遠。

奧丁數(shù)字人歌手

而如果將數(shù)字人視作新一代交互載體,其以語言、聲音和動態(tài)的三維視頻圖像為主的交互方式,無疑更接近真人,也契合了元宇宙顛覆移動互聯(lián)網(wǎng)的設(shè)想。

但另一方面,顛覆性的想象意味著前所未有的難度。當前的數(shù)字人賽道看似風光無限,但從呈現(xiàn)效果、制作周期、制作成本等多個角度,數(shù)字人好看的皮囊,以及「智慧」程度都還遠未達到「元宇宙人」的級別。

「新聲Pro」找到了為某衛(wèi)視綜藝節(jié)目虛擬藝人提供數(shù)字化服飾技術(shù)的團隊,面對尚處野蠻生長的市場和眾多概念公司,奧丁科技一直基于自研的硬件、軟件、算法和AI等綜合能力,讓數(shù)字人更加逼真和智能,并通過仿生學和人類學研究不斷降低成本,增加產(chǎn)能,完成超寫實數(shù)字人的普及。公司經(jīng)過2年多的研發(fā),正式推出了奧丁數(shù)字智慧人。

奧丁科技數(shù)字人Yola

奧丁科技業(yè)務負責人張玥說:「某種程度上奧丁科技算是個異類,因為我們不習慣按行業(yè)原有的方向前進,而更希望通過自身數(shù)字人底層技術(shù)的突破,成為整個行業(yè)的破局者,真正地為元宇宙造仿生學智慧人?!箠W丁的名字也是借鑒了北歐神話中眾神之父奧丁賦予人類生命和靈魂之意。

不趕風口,只講需求

一方面,現(xiàn)在的數(shù)字人與元宇宙似乎呈現(xiàn)綁定關(guān)系,眾多從業(yè)者及投資人紛紛跑步入場,唯恐錯失良機。一時間做數(shù)字人不提元宇宙者,頗有與時代脫節(jié)之嫌。

但另一方面,需要明確的是,元宇宙代表的是對未來美好愿景的集合,其中所涉及到的VR&AR、AI、引擎、動作捕捉、3D仿真等諸多先進技術(shù),即使沒有元宇宙的概念,也會穩(wěn)步向前發(fā)展,數(shù)字人技術(shù)便是其中典型。

張玥表示,奧丁科技團隊已經(jīng)在這個領(lǐng)域投入科研2年多,并不是盲目追逐元宇宙的風口,公司對數(shù)字人一直保持著底層技術(shù)的研究,已經(jīng)掃描制作完成上百個數(shù)字人模型,其中還包含諸多明星。

數(shù)字藝人復原

根據(jù)奧丁科技的觀察,市場對數(shù)字人有很大需求,而且需求長期存在。

市場研究機構(gòu)量子位發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報告》指出,預測到2030年,中國虛擬數(shù)字人整體市場規(guī)模將達到2700億元。

首先在傳統(tǒng)的游戲領(lǐng)域,作為目前數(shù)字人應用最多的場景,在游戲中數(shù)字人可以作為游戲角色存在,或擔任游戲NPC,對玩家完成任務指引,提升玩家游戲體驗感。而跳脫出游戲范疇,在其他領(lǐng)域,數(shù)字人也有廣泛的應用場景。

以服務型數(shù)字人為例,大體可分為虛擬偶像,虛擬主播,虛擬導覽三大類。其中虛擬偶像可以服務于音樂、影視、MCN機構(gòu),生產(chǎn)優(yōu)質(zhì)內(nèi)容;虛擬主播則可應用于電商、短視頻、游戲直播等領(lǐng)域,創(chuàng)造經(jīng)濟效益;虛擬導覽則可用于政府代言,虛擬導覽,提供便民服務。

虛擬手語主播

但旺盛的市場需求背后,是貧瘠的數(shù)字人生產(chǎn)能力。

在加盟奧丁科技之前,張玥曾擔任文投控股(成龍耀萊文化)總經(jīng)理,并主導并購了世界第三大特效公司Framestore。20年來對公司戰(zhàn)略,市場和運營管理的經(jīng)驗,以及豐富的海外工作背景,讓張玥對影視特效、游戲以及AI的新動向非常敏感。

她發(fā)現(xiàn)如果以傳統(tǒng)的電影特效制作數(shù)字人,制作過程需要用CG技術(shù)一點點精雕,雖然呈現(xiàn)效果優(yōu)質(zhì),但數(shù)字人的制作成本非常高昂,好萊塢有時一秒鏡頭可能耗資就在百萬美元,而且制作周期很長。

既然市場存在需求,且現(xiàn)有的技術(shù)方案無法解決,自然意味著更大的發(fā)展前景。

技術(shù)極客

在決定進入數(shù)字人市場后,奧丁科技很快確定了公司發(fā)展的方向:分階段「做表演級的數(shù)字智慧永生人?!?/p>

第一目標是數(shù)字人先能表演,不僅要在皮膚、頭發(fā)、衣著等外表上與真人形似,還應該能通過一顰一笑、傷心流淚等表情傳遞情緒,達到神似的效果。而且整個生產(chǎn)過程應該又好又快,最終達到可批量化生產(chǎn)超寫實數(shù)字人。

奧丁國風數(shù)字人表演

第二目標是整合多種技術(shù)實現(xiàn)數(shù)字人的智慧,由AI學習系統(tǒng)、腦科學和語言聲音系統(tǒng)共同完成。最終目標則是數(shù)字永生,也就是賦予未來的數(shù)字人「靈魂」,讓其擁有性格與思維,并可以自我進化。

在當前數(shù)字人市場上,以單點打爆做IP營銷者有之,也不乏批量化生產(chǎn)較為粗糙的二次元虛擬形象者。但如奧丁科技定位在生產(chǎn)超寫實數(shù)字人,同時要兼顧產(chǎn)能和效率的公司,其實并不多見。

奧丁科技首席技術(shù)官 Grissom介紹說:「我們做事方式很獨特,因為我們不會覺得行業(yè)都這么做,就應該如此。對奧丁科技來說,不僅要把數(shù)字人做好,還應該以技術(shù)極客的方式做好?!?/p>

奧丁科技技術(shù)極客的風格與其團隊構(gòu)成有很大的關(guān)系。

奧丁科技身后有兩位參與創(chuàng)辦公司的天使投資人,一位是華文創(chuàng)投的創(chuàng)始人姜山,有20年互聯(lián)網(wǎng)科技和文娛產(chǎn)業(yè)經(jīng)驗,堅持以科技與內(nèi)容為核心,圍繞年輕人未來娛樂消費場景投資,孵化新物種新模式;另一位是智慧基石創(chuàng)始人雷鳴,是百度七劍客之一,北大人工智能創(chuàng)新中心主任,一直致力于AI領(lǐng)域研究。同時奧丁科技的產(chǎn)品負責人Grissom是做游戲出身,曾擔任過Gamebryo引擎的亞洲區(qū)技術(shù)支持,也做過硬件和驅(qū)動技術(shù),擁有綜合的技術(shù)能力。

奧丁科技自研多款應用工具

據(jù)「新聲Pro」了解,目前奧丁科技的團隊規(guī)模在50人左右,其中研發(fā)人員占比在90%以上。

奧丁科技首席技術(shù)官 Grissom表示,公司在搭建團隊時,所挑選的都是各方面的尖端人才,所涉及的面也很廣泛。既有做電影特效出身,把握鏡頭和呈現(xiàn)效果的技術(shù)人員;還有一部分是IT人才,負責軟件和算法優(yōu)化;還包括一些硬件公司的人才?!肝覀儚挠布杰浖剿惴ǘ加袌F隊?!?/p>

扎實的研發(fā)團隊,讓奧丁科技科技可以通過技術(shù)革新,解決大量數(shù)字人市場上存在的困局。

在最直觀的靜態(tài)呈現(xiàn)方面,當前數(shù)字人的呈現(xiàn)效果并不理想,尤其是在對真人的還原上,大部分還是偏重于二次元風格的設(shè)計。

以數(shù)字人的面部效果為例,原本要達到影視級的皮膚、毛孔細節(jié),需要藝術(shù)家花費大量時間進行雕刻。而奧丁科技則可以通過畫面捕捉、體感控制及畫面渲染技術(shù),還原數(shù)字人面部的各個細節(jié),讓數(shù)字人纖毫畢現(xiàn)。

奧丁數(shù)字人面部細節(jié)

在具體操作步驟上:奧丁技術(shù)團隊會使用自研的硬件設(shè)備,配合數(shù)據(jù)采集手段完成數(shù)據(jù)掃描,之后結(jié)合數(shù)據(jù)處理系統(tǒng),和深度學習的算法,還原數(shù)字人皮膚和毛孔細節(jié)。保證生產(chǎn)的數(shù)字人模型在拉到近景特寫后,毛孔和皮膚紋理等細節(jié)都可以真實還原。據(jù)悉,奧丁科技的3D數(shù)字資產(chǎn)積累已經(jīng)達到了十幾T,在行業(yè)內(nèi)是極為少見的。

除了靜態(tài)呈現(xiàn),數(shù)字人還面臨著另一個更高維度的技術(shù)難題:無法做到對真人表情的還原,從而傳遞情感。即便是由Epic出品的全球頂尖虛擬形象生成軟件Metahuman,其所制作的數(shù)字人也無法傳達微表情。

Grissom表示,在經(jīng)過詳盡的市場調(diào)研后,他發(fā)現(xiàn)市場上主流做數(shù)字人表情的思路,都是「最終呈現(xiàn)」。也就是說觀眾看到的只是一個單純的笑容,或者流淚表情,而并不是一個從不笑到笑,從不哭到哭的動態(tài)過程。但在現(xiàn)實情況中,人的情感波動再由表情傳達,必定是一個動態(tài)變化的過程。

因此奧丁的思路是還原表情的變化過程。為此團隊推出了「表情方案+表情驅(qū)動」的解決方案。

通過自主研發(fā)的硬件設(shè)備,微表情級別的數(shù)字人面部捕捉系統(tǒng),配合綁定系統(tǒng)以及面部驅(qū)動方案,奧丁科技可以讓數(shù)字人表情還原度超過90%,且具有一定的表演能力。

匹配應用場景

張玥表示,「數(shù)字人市場有很大的想象空間,在完成一定的技術(shù)積淀后,奧丁科技希望將成熟的技術(shù)匹配到更大的應用場景,同時研發(fā)新技術(shù),去引領(lǐng)應用場景走向新階段,最終由TO B走向To C,這個戰(zhàn)略公司會長期堅持?!?/p>

在當前階段,奧丁科技技術(shù)的主要應用場景,還是在服務B端客戶。

據(jù)「新聲Pro」了解,目前奧丁科技已經(jīng)與多位行業(yè)客戶進行合作,包含影視、電競、音樂、動畫、電商、短視頻、直播、綜藝、文旅、奢侈品等。比如為影星克拉拉打造了完整的面部、肢體、表情等全部數(shù)字人資產(chǎn);為《前沿訪談》打造商業(yè)大佬們的數(shù)字分身;數(shù)字服裝潮牌;為NFT產(chǎn)品提供虛擬場景。

奧丁科技首席技術(shù)官 Grissom透露,在為某衛(wèi)視綜藝節(jié)目虛擬人制作全套服裝時,由于需要配合節(jié)目的錄制檔期,同時還要在錄制現(xiàn)場虛擬人和眾多真人明星完成互動,對時間要求非常迫切。最終的結(jié)果來看,奧丁的數(shù)字化服裝和綁定的呈現(xiàn)效果收獲了眾多好評,傳統(tǒng)的虛擬人制作公司需要3月的時間,而奧丁利用自己的材質(zhì)硬件設(shè)備開發(fā)周期僅在1周左右,并用于直播,完成了客戶緊急要求,這些都離不開奧丁科技在技術(shù)端的創(chuàng)新。

姜山、吳歷華數(shù)字替身出現(xiàn)在 EDG 電競節(jié)目中

當前階段,數(shù)字人在進行模型制作和數(shù)據(jù)采集時,主流方案還是大量采購單反相機組成3D矩陣,輔以人工大量修復,這樣的操作流程無疑需要更高的時間成本和人力成本。而奧丁科技通過自研的虛擬技術(shù)系統(tǒng),讓數(shù)字內(nèi)容在研究、制作、使用等各個環(huán)節(jié)變得更加規(guī)范,可以通過標準化操作提升效率。

Grissom表示,由于整個公司90%都是技術(shù)極客,因此做事的方式就是會把任何一個重復的勞動變成程序化操作,「只要是電腦能干的事我們就絕對不用人工。」同時內(nèi)部有一套自己的工作流程,除了人工處理數(shù)據(jù)修復的部分,團隊在平時就會大量去做內(nèi)部的工具,因此團隊的執(zhí)行能力和生產(chǎn)效率都很高。

除此之外,奧丁團隊還對接了工業(yè)生產(chǎn)中服裝建模的流程,可以完成工業(yè)級別的服裝仿真結(jié)算。相比于傳統(tǒng)的3D建模軟件,對接工業(yè)設(shè)計模型既能讓數(shù)字人服裝的物理真實度更佳,也能使服裝生產(chǎn)效率得到提升。

服裝布料系統(tǒng)

張玥認為,盡管目前公司以服務行業(yè)客戶為主,但根據(jù)不斷升級的技術(shù)能力和奧丁對數(shù)字人四個階段的規(guī)劃,公司未來會進入更廣大的C端市場,真正完成數(shù)字人的普及和生長。當前公司擁有的多項硬件與軟件知識產(chǎn)權(quán);可服務于AI深度學習的3D數(shù)字資產(chǎn);影視級面部及身體動作捕捉系統(tǒng)等一系列技術(shù)優(yōu)勢,都將繼續(xù)迭代,以數(shù)字人為入口,面向下一代高互動性的VR內(nèi)容。

關(guān)鍵詞: 奧丁科技為元宇宙造智慧人|虛實之間

 

關(guān)于我們 - 聯(lián)系我們 - 版權(quán)聲明 - 招聘信息 - 友鏈交換

2014-2020  電腦商網(wǎng) 版權(quán)所有. All Rights Reserved.

備案號:京ICP備2022022245號-1 未經(jīng)過本站允許,請勿將本站內(nèi)容傳播或復制.

聯(lián)系我們:435 226 40@qq.com