隨著元宇宙概念的火爆也一同帶動了數(shù)字人市場的快速升溫,據(jù)計算全球平均每天都會誕生一個數(shù)字人。數(shù)字人正成為一股潮流,涌入人們的日常生活——會“捉妖”的虛擬美妝達人柳夜熙,抖音出道三天點贊即超百萬,一夜之間成為國內虛擬偶像界的“頂流”;在江蘇衛(wèi)視跨年演唱會上,昔日歌后鄧麗君“重返”舞臺,與歌手周深同臺對唱,交織幾代人的青春記憶;而在杭州亞運會上,數(shù)字人點燃火炬,成為開幕式的亮點。除此之外,數(shù)字人擔當起手語主播、氣象主播、公益宣傳、帶貨達人等各式角色,代替真人提供服務支持……
一、什么是AI數(shù)字人?
數(shù)字人的核心是“人”,本質上是通過數(shù)字技術提高數(shù)字人的綜合體驗,使之帶來真人般的感受和互動。
一方面,隨著人工智能、虛擬現(xiàn)實、高精度渲染等技術的發(fā)展和融合,數(shù)字人的擬人化程度愈來愈高,從形象、表情、姿態(tài)、動作,再到語音、語意、語態(tài)等方方面面正在逐步逼近真人水平。例如,超寫實數(shù)字人(Metahuman)已成為當前主流,柳夜熙、“鄧麗君”等都是超寫實數(shù)字人的代表,擁有高度逼真的數(shù)字化外觀形象。
另一方面,人工智能技術在數(shù)字人形象生成、動作驅動和語言交互等環(huán)節(jié)的深入應用,也將進一步提升數(shù)字人制作的自動化水平,推動數(shù)字人市場從利基走向大眾。
數(shù)字人的擬人化,以及生產制作的自動化程度反映數(shù)字人系統(tǒng)整體進化和發(fā)展水平,代表著數(shù)字技術綜合運用能力和成熟度體現(xiàn)。
根據(jù)“擬人化”和“自動化”兩個維度,我們可以將數(shù)字人分成 L1-L5 五個等級,如下圖所示。
其中,我們將 L4 和 L5 等級的數(shù)字人統(tǒng)稱為“AI 數(shù)字人”。Ta 們不僅具備高度的擬人化呈現(xiàn),在形象、動作和智力層面都更接近于真人水平,能夠聽懂、看懂、有記憶、自學習,與人進行自然交互;同時,在制作流程中也融合了大量的人工智能算法技術來提升數(shù)字人的生產效率,降低數(shù)字人的制作成本。普遍認為,只有達到 L4 級別及以上的數(shù)字人才能真正的走入千行百業(yè),在消費和產業(yè)領域大放異彩。
二、AI數(shù)字人的三大特征
多模態(tài)交互、深度學習和 AIGC是 AI 數(shù)字人的三大特征。
首先,在應用層面,多模態(tài)交互是 AI 數(shù)字人的“核心力”。
我們認為,具備足夠自然和擬真的多模態(tài)交互能力,是數(shù)字人在更廣泛的應用場景中逐步替代真人角色的關鍵。所謂“多模態(tài)交互”,即是將深度學習神經網絡和計算機圖形學相結合,充分模擬人與人之間自然真實的交互方式,實現(xiàn)“聽得懂,看得見,說得出”的人機交互效果。
擁有多模態(tài)交互能力的 AI 數(shù)字人,不僅能夠呈現(xiàn)傳統(tǒng)語音對話無法展現(xiàn)的多媒體信息,通過結合計算機視覺技術,還能完成身份識別、手勢識別、情感識別等多項交互任務,讓交互過程更加豐富且高效。與此同時,可
視化的寫實形象也賦予了 AI 數(shù)字人獨特的情感溫度,有助于建立人性化的情感紐帶。
其次,在價值層面,深度學習是 AI 數(shù)字人的“創(chuàng)造力”。
每一個 AI 數(shù)字人背后都有一個“智慧的大腦”,可以基于語音語義理解等技術,結合不同領域的知識庫和海量數(shù)據(jù)訓練,進行深度學習和迭代升級,讓自己變得越來越“聰明”,越來越專業(yè),從而能夠快速適應瞬息萬變的市場變化和細分化的場景需求,不斷打破即有的應用邊界,為用戶持續(xù)創(chuàng)造新價值和新體驗。
第三,在制作層面,AIGC 是 AI 數(shù)字人的“生產力”。
高制作成本和長制作周期掣肘數(shù)字人產業(yè)規(guī)?;l(fā)展。傳統(tǒng)數(shù)字人生產過程中,從人物建模到動畫設計和制作等各個環(huán)節(jié)幾乎都依賴人工“雕琢”而成。譬如,以人物建模為例,傳統(tǒng)建模環(huán)節(jié)大概要花費數(shù)月時間。此外,要讓模型動起來,前面的準備工作(蒙皮、BlendShape 等)以及后續(xù)的動畫制作及優(yōu)化環(huán)節(jié)也需要花費數(shù)月時間,無論是時間成本還是人工成本都是一個相對較大的投入。
AIGC 重塑生產流程,在人物模型的重建、動畫準備和制作等各個環(huán)節(jié)輔助數(shù)字人自動化生成,大幅加速數(shù)字人生產,降低制作門檻和成本投入,是 AI 數(shù)字人生產力之本。以人物建模環(huán)節(jié)為例,例如,商湯科技為軟銀大會打造的軟銀 COO 今井康之的 AI 數(shù)字人形象,即是基于少量照片的面部掃描,結合 AI 算法快速生成數(shù)字人高精度 3D 模型,將傳統(tǒng)以月計算的制作周期縮短至數(shù)天內完成。
三、AI數(shù)字人的三大應用方向
根據(jù)使用目的和底層邏輯不同,AI 數(shù)字人可大致分成三大應用方向。
方向一:主要以創(chuàng)建 IP 影響力或打造粉絲經濟為目的的 AI 數(shù)字人應用,包括虛擬偶像、虛擬 KOL、虛擬演員、虛擬主播等。
基于“IP 孵化 + 內容運營”,賦予 Ta 們獨特的人設和人格特質,以此來吸引不同受眾群體的關注,從而形成一定規(guī)模的流量基礎和情感鏈接,再通過諸如直播帶貨、跨界品牌代言、IP 授權周邊衍生品、娛樂演藝等多種手段來實現(xiàn)價值閉環(huán)或進行商業(yè)化變現(xiàn)。
方向二:主要以替代真人服務、實現(xiàn)降本增效為目的的 AI 數(shù)字人應用,包括虛擬客服、虛擬前臺、虛擬導游、虛擬主持人等。
Ta 們根據(jù)各自領域所長,能夠“7×24 小時”在崗不間斷的提供服務支持,尤其針對標準化、重復性高的真人服務可以實現(xiàn)數(shù)字化替代,并結合業(yè)務流程自動化,幫助企業(yè)進一步提高生產效率、降低人工服務成本,為企業(yè)數(shù)字化轉型提供新路徑。
方向三:隨著人工智能、虛擬現(xiàn)實等相關技術的逐步成熟,通過深度學習和認知泛化,AI數(shù)字人將會全面突破應用邊界,升級成為數(shù)字世界的“超級助手”。
與前兩個應用方向不同,AI 數(shù)字人的第三大應用方向不再僅遵循真實世界的“替代”邏輯,初衷更在于滿足用戶與數(shù)字世界的連接和交互需求,實現(xiàn)對于數(shù)字世界的直接操作。正如《元宇宙”破壁人“:做虛實融合世界的賦能者》白皮書中所描繪的圖景一樣,“這些數(shù)字人將成為我們在數(shù)字世界的 AI 代理人”。通過與 Ta們的直接交互,可以“隨機應變”的針對用戶個性化、多樣化需求,提供全天候、全方位的人性化陪伴和智能化服務,成為人們通向虛實融合世界的超級入口。
四、AI數(shù)字人的八大應用場景
場景1:金融網店“新窗口”
商湯為寧波銀行上海分行打造的超寫實型 AI 數(shù)字人大堂經理“小寧”,以栩栩如生的客服形象為銀行客戶提供各類業(yè)務咨詢和服務辦理。
生動的形象和擬真的交互體驗,AI 數(shù)字人讓銀行客戶倍感新鮮,有效提升了客戶關注時間,不僅能為銀行創(chuàng)造更多業(yè)務推廣機會,在網點“智能化、無人化”的趨勢下,成為銀行服務線下客群的“新窗口”,以及提升服務效率、提高服務質量和標準的重要載體。
場景2:在線互金“新入口”
基于手機銀行在線服務問題,渤海銀行與商湯合作開發(fā) AI 數(shù)字人“小海豚”,以生動、可愛的 3D 卡通形象,為渤海銀行的線上用戶提供全程“貼身服務”,包括自助式業(yè)務引導和辦理、金融知識的專業(yè)講解,以及理財產品的智能推薦等,為客戶創(chuàng)造全新的交互觸達式體驗,成為手機銀行提供在線互金服務的“新入口”。
例如,在自助業(yè)務辦理上,小海豚可以正確“理解”客戶需求,并快速定位到客戶所需辦理的業(yè)務界面,大大縮減了繁瑣的操作流程,幫助客戶高效完成業(yè)務辦理,為客戶提供了一個親切交互、快捷便利的無障礙金融體驗。
場景3:商場交互“新觸點”
廣州新塘的永旺夢樂城與商湯聯(lián)合打造了超寫實型 AI 數(shù)字人“小糖”,主要承擔商場內客服咨詢、導航導購等多項服務工作。
例如,作為虛擬客服人員,“小糖”可以隨時隨地為顧客提供準確、快速的店鋪位置導覽、停車路線指引、積分兌換等問詢服務。當遇到“超綱”問題時,后臺管理人員可以及時進行遠程接管。作為虛擬導購員,“小糖”通過與顧客的自然交互和意圖理解,判斷顧客的實地需求,將新品上線、新店開業(yè)、優(yōu)惠活動等商場或店鋪信息更有效的向顧客進行精準推薦,有助于營銷轉化效果的提升。
場景4:文博講解“新體驗”
中共一大紀念館與商湯合作,于 2021 年建黨 100 周年之際在展館內推出 001 號 AI 數(shù)字人講解員“申小伊”。Ta 不僅能夠主動迎接和問候,還能為來自全國各地的參觀群眾和黨員干部講解中共一大黨史。
在形象設計上,“申小伊”達到了超寫實級別精度,嚴格遵循紀念館內制服標準著裝“上崗”;在講解專業(yè)性上,“申小伊”基于中共一大相關的黨史典籍建立知識庫體系進行深度學習,并通過知識泛化覆蓋上萬條黨史問題,不僅能夠熟練講解黨史內容,還能輕松解答各類黨史相關問題。
場景5:品牌營銷“新代言”
商湯基于 AIGC,僅結合幾張真人照片即快速生成超寫實 AI 數(shù)字人“大真”。Ta 不僅可以充當活動虛擬主持,與同臺真人主持一起與觀眾進行實時互動,還可以登錄直播間 24 小時不間斷直播帶貨,與用戶“面對面”進行彈幕互動,自助解答品牌相關問題。
場景6:企業(yè)前臺“新形象”
根據(jù)企業(yè)形象定制的 AI 數(shù)字人,不僅擁有符合企業(yè)文化氣質的外觀形象,還能替代真人前臺根據(jù)員工預約信息,對已預約的到訪客戶進行主動式的迎賓接待,并基于豐富的企業(yè)知識庫體系,為到訪客戶進行企業(yè)介紹、發(fā)展歷程的講解,并能與訪客進行實時對話,親切耐心地解答企業(yè)相關問詢。
場景7:指揮車艙“新助手”
車機大屏已成為新一代智能終端,承載著載具內人機交互、調用軟件服務等功能,也影響著智慧車艙的交互體驗。將車機系統(tǒng)功能進行集成,并通過生動的 AI 數(shù)字人形象作為人機交互的主要媒介,相對傳統(tǒng)語音或觸屏等方式,為車主帶來更具個性化、人格化的行車體驗。
場景8:虛擬活動“新服務”
在沉浸式活動 / 會議系統(tǒng)中,AI 數(shù)字人可以作為活動隨行助手,全程“陪伴”參會者左右,隨時隨地提供咨詢服務,回答活動相關問題,并提供活動接待、講解、導覽、記錄、推介等各類服務和支持。一方面減少活動主辦方人工客服投入,提升用戶體驗;另一方面可以通過對 AI 數(shù)字人交互數(shù)據(jù)的收集和分析,幫助主辦方掌握參會人員實際需求,更好的實現(xiàn)活動效果的轉化,達到主辦活動的目的。