數(shù)字人應用漸成趨勢 商湯如影2.0支持4K多語種

來源:經(jīng)濟參考網(wǎng)

隨著AIGC技術的進步,“數(shù)字人”也迎來了快速發(fā)展期。在大數(shù)據(jù)與語言大模型的加持下,“數(shù)字人”的表述變得更加個性化、多元化,也開始被應用到越來越多的場景之中。

如今,我們不僅在直播間、短視頻平臺上能看到越來越多的數(shù)字人形象,還能在圖書館、商場的電子屏幕上發(fā)現(xiàn)數(shù)字人的身影。


(資料圖)

那么,如何才能獲取一個屬于自己的“數(shù)字人”呢?

在應用商店里,我們發(fā)現(xiàn)商湯科技研發(fā)的“如影”App已經(jīng)上線,同時官方還啟動了AIGC百“變”大咖共建計劃。目前,已經(jīng)有張泉靈、任澤平、延參法師、季衛(wèi)東等知名人士參加了該活動,同時定制了鮮活逼真的數(shù)字分身。

據(jù)了解,“如影”App正是基于商湯科技“日日新SenseNova”大模型體系開發(fā)的。借助AI數(shù)字人視頻生成算法、語言大模型、AI文生圖、AIGC等多種能力,只需一次真人素材錄入,商湯如影就能生成超寫實的數(shù)字分身,實現(xiàn)高質(zhì)量、高效率的數(shù)字人視頻內(nèi)容創(chuàng)作,推動視頻內(nèi)容創(chuàng)作的方式革新。

擁有量身定制的“數(shù)字人”之后,Ta能代替我們出現(xiàn)在哪些場景?

“未見其人,先聞其聲”,聲音是模仿一個人的關鍵。定制好數(shù)字人后,只要輸入你喜歡的歌曲音頻,數(shù)字人就能根據(jù)你的音色演唱任何歌曲。在各種播客平臺,量產(chǎn)音頻不是夢。

除了復刻你本來的樣子,數(shù)字人的外貌也可以完成個性化定制。在商湯秒畫大模型的支持下,僅需輸入簡單的提示詞,商湯如影就能直接生成與之匹配的形象,且版權完全屬于自己。

商湯數(shù)字人也可以將外貌與聲音完美融合,表情、口型都能自然而逼真地呈現(xiàn),再加上一些肢體動作,生成短視頻也不在話下。在上海長寧圖書館,商湯打造的數(shù)字人“馨葉”已經(jīng)成為正式的引導員,不僅能根據(jù)讀者個人喜好推薦館內(nèi)書籍、完成借閱和座位預約等操作,還能與讀者自然對話,再加上表情、手勢和動作,交互體驗十分優(yōu)秀。

據(jù)悉,商湯如影2.0在英語、日語、阿拉伯語等多語種的語音和口型流暢度提升30%以上,表達自然不違和。現(xiàn)在還可以生成4K分辨率的視頻,畫質(zhì)更高清。

目前,商湯如影已與多個短視頻、直播頭部企業(yè)達成戰(zhàn)略合作,共同打造“云+AIGC+短視頻直播”合作生態(tài)。同時還推出了“千城百業(yè)”如影繁星合作伙伴共建計劃,為不同行業(yè)場景的企業(yè)和大眾,提供更高效、低成本、便捷易用的AI視頻和營銷工具。

雖然已經(jīng)有很多大企業(yè)推出了數(shù)字人產(chǎn)品,但在成熟度方面,商湯走在了行業(yè)前列。

全球知名研究機構弗若斯特沙利文(Frost &Sullivan)聯(lián)合頭豹研究院發(fā)布了《2022年中國數(shù)字人市場觀測報告-里程碑》。報告顯示,商湯科技數(shù)字人已全面進入“成熟階段”成為市場領導者,并在十個評估指標中獲得六項最高分,廠商整體競爭力排名第一。同時,據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的《中國AI數(shù)字人市場現(xiàn)狀與機會分析,2022》報告顯示,商湯科技憑借出色的產(chǎn)品能力、商業(yè)化案例、用戶體驗和戰(zhàn)略愿景,位列數(shù)字人廠商格局的第一梯隊。

標簽:

推薦

財富更多》

動態(tài)更多》

熱點