21世纪经济报道记者张梓桐上海报道
编者按
元宇宙(Metaverse),这个来源于科幻小说的概念,已成为真实世界中的流行语。围绕这一新兴概念,一场产、学、研的实践正在展开。数字化转型中,元宇宙能否担当大任?这些新概念在中国语境下如何落地?南财合规科技研究院数字娱乐课题组策划了《瞭望元宇宙》系列报道,以期为行业和社会公众提供理解元宇宙的敲门砖。
(资料图)
数字人作为元宇宙的“原住民”,成为了近年来业界与学界讨论的重点,目前业界普遍认为,数字人的大规模应用依赖于高写实度的效果、好的生产效率和可控的成本。但与此同时,终端的运行叠加算力上的需求对实时云渲染能力形成了挑战。系列报道第六篇,我们探讨元宇宙赖以运行的底层技术,以及其背后的实际产业应用。
近年来,随着人工智能、虚拟现实等新技术的快速发展,虚拟数字人开始进入普通人的生活。而在新奇的外观形象、灵巧的互动效果之外,行业也正在挖掘出数字人更多的潜力。
“未来数字人的发展,正呈现出静态向动态、2D向3D、卡通向写实、单向向多向互动的趋势。”蔚领时代创始人兼CEO郭建君在接受21世纪经济报道专访时表示,数字人领域目前已经度过萌芽期,进入了快速成长阶段,不久的将来会迎来爆发期。这也意味着行业开始进入商业化变现探索的关键阶段,标准化也将逐渐建立。
但在丰富的想象空间之外,一些落地的问题仍然困扰着从业者与用户。在未来,数字人是否可以实现高度实时性,高度可灵活性和高度适应落地场景,并与人类进行有效的交互,仍有待时间去验证。
面临品质成本双难题
中国人工智能产业发展联盟发布的《虚拟数字人发展白皮书》显示,“虚拟数字人”一词最早源于1989 年美国国立医学图书馆发起的“可视人计划”(Visible Human Project, YHP)。2001年, 国内以“中国数字化虚拟人体的科技问题”为主题的香山科学会议滴174次学术讨论会提出了“数字化虚拟人体”的概念。
但在当时,这些“虚拟数字人”主要是指人体结构的可视化,以三维形式显示人体解剖结构的大小、形状、位置及器官间的相互空间关系。与当下所探讨的元宇宙中的“原住民”数字人有较大的含义出入。
近五年得益于深度学习算法的突破,数字人的制作过程得到有效简化,虚拟数字人开始步入正轨。
同时,这也吸引到政策层面的关注。
2022年8月,北京市经济和信息化局发布了国内首个数字人产业专项支持政策——《北京市促进数字人产业创新发展行动计划(2022—2025年)》(以下简称《计划》)。《计划》提出,抓住以数字人为代表的互联网3.0创新应用产业机遇,充分发挥国际科技创新中心建设优势,打造数字人产业创新高地。
《计划》提出了发展目标,“到2025年,北京将培育1—2家营收超50亿元的头部数字人企业、10家营收超10亿元的重点数字人企业,建成10家校企共建实验室和企业技术创新中心,打造5家以上共性技术平台,培育20个数字人应用标杆项目,建成2家以上特色数字人园区和基地等目标。”
但行业现状似乎与《计划》提出的目标仍有一定距离,21世纪经济报道记者多方了解到,目前来看,一些企业在打造数字人的过程中仍会遇到渲染品质较低、制作成本高昂,IP打造周期长等难题。
京东集团副总裁、京东智能产品与服务部总裁何晓冬在接受21世纪经济报道采访时表示,数字人是数字原生、人机交互等技术落地过程中最被寄予希望的形态之一,但在实际应用的过程中,有些数字人的动作十分僵化,只能起到展示的效果,无法提供实际办理业务的交互。
何晓东以银行场景的数字人举例称,如果数字人要把整套银行业务办理好,需要克服几个非常落地的问题。“首先是需要避免噪音,因为银行柜台是比较噪杂的场所。其次是银行数字人需要和后台的业务支持系统有效地对接,必须能够解决很多银行的具体业务问题。”何晓东举例称,转账、取钱、改密码等业务行为都意味着数字人在知识推理、语音推理等方面都要达到很高标准,因此这些方面的同步也是很大的挑战。
三种商业模式
郭建君在采访中也表达了类似看法,他表示,数字人成熟的背后一方面是技术整合能力,另一方面是IP运营能力。“数字人是一个产业链很长的行业,既需要底层引擎技术的发展,也需要对上层工具和生产管线的优化,才能同时满足数字人形象好、生产效率高和成本可控的三重效果。”
而IP运营能力体现在对数字形象打造的思路和经验之上。郭建君表示,当前行业较为普遍的情况是,技术制作更有信心,运营思维比较欠缺。在这方面,蔚领时代正在探索的一条道路是——选择更专业的生态伙伴合作进行商业化。
近日,蔚领时代与文娱企业海西传媒集团组建了独立运营的公司蔚海灿娱,推出了龚俊的数字人“霁风”,郭建君表示,后续将围绕可互动数字IP的矩阵搭建、共创虚拟空间的构建等方面进行多重合作。
值得一提的是,利用契合特定场景的IP加快表演型数字人创新也是《计划》的规划的主要任务之一,其提出要“促进技术人才与艺术人才联合创新,加快数字人IP孵化,培育创作者经济。同时打造精品数字人品牌,支持数字人参与广告营销、品牌代言,加强数字人运营管理,树立传播正能量的数字人形象。”
事实上,IP运营,客户服务和流量变现正是当前数字人主要的三种商业模式。
腾讯云近日发布的《数字人产业发展趋势报告(2023)》指出,内容/IP型数字人主要依靠数字人的商业IP运营实现商业变现,功能服务型是交付给客户实现变现,而虚拟分身则需要结合虚拟空间的设定和规则进行流量变现。
“数字人的制作成本和周期伴随定制化程度的下降而递减。三种数字人的制作方式和周期也存在差异,内容/IP型数字人更多是项目制,以定制为主;功能服务型是产品和定制化相结合,在通用产品上,进行定制化开发;而虚拟分身更多是产品制,用户利用平台工具产品进行数字人形象的制作并在相应虚拟场景内进行活动,一般而言,内容/IP型数字人的成本和周期最高,虚拟分身型数字人最低。”
大规模应用依赖可控成本
“数字人的大规模应用,有三个条件必不可少:高写实度的效果、较高的生产效率和可控的成本。”在郭建君看来,虽然对比传统离线渲染的影视级别的写实度效果仍然需要提升,但当前行业应用的实时渲染的技术,在生产效率、可控成本和数字人可互动性上均具备了优势。
科技部信息通信专家、上海流程智造科技创新研究院院长贺仁龙告诉21世纪经济报道记者,构造虚拟世界的技术正在逐渐成熟,应用的场景也日益丰富,效果也十分逼真。但在感知交互方面,数字人仍然面临着一系列问题。”
“在创建元宇宙的过程中,会构造一个世界的秩序和逻辑,但这个世界是否有重力,重力又是多少,目前来看都是技术需要探索的方向。同时,虚拟世界的逻辑需要规律和算法生成,在这其中,如何有效地使数字人在视觉、听觉之外,与用户进行触觉感知交互,也是行业面临的难题。”
“未来超写实的世界将以可视化为主要特征。而这需要海量的图形运算。”郭建君认为,VR/AR终端将成为元宇宙的入口,但终端的运行依赖算力高速的运行,这其中,实时云渲染能力解决的就是把超写实的世界带到终端体验上的问题。
“只有云端实时渲染在达到较高标准的情况下,才能真正带来足够写实、互动、有沉浸感的图像画质。这也就是蔚领时代认为的GaaS(Graphics as a Service)时代到来的逻辑依据。”
郭建君认为,未来支撑实时云渲染的底层技术主要是云原生的技术,比如多GPU协同渲染,以及C+S架构来实现的单个进程输出几十路视频流供几十个玩家游玩的技术。“这些创新的云原生的技术是未来元宇宙的支撑,同时围绕着类似云游戏的串流能力和云端虚拟化的能力,也是未来元宇宙所需要的。”
“一个可喜的现象是我们看到头部渲染引擎的技术发展迅速,现在已经开始进行影视级效果的应用了。”郭建君说道。
在云原生技术之外,3D重建技术的发展也为数字人的大规模落地带来了更多的可能性。
上述《报告》指出,2D数字人和3D数字人生成/建模方式不同,2D数字人本质是生成图像,因此主要方式是利用深度学习技术根据视频生成与真人相同的图像,技术相对成熟。
“3D数字人需要建立3D模型,主要是利用软件传统的手工建模、静态扫描建模(相机阵列扫描建模)、动态光场或者AI建模(3D重建技术)生成3D模型。目前手工建模和静态扫描建模技术较为成熟且应用广泛,利用3D重建技术或动态光场重建可极大节约建模时间,提升建模效率,是未来重要布局方向。”报告指出。
而在科大讯飞总裁吴晓如看来,机器想更自然地与人类进行交互,需要通过听觉、视觉、语义以及各种传感器的组合去获取更多的有用信息,AI感知方式必然要从单模态发展到多模态,逐步拟人化。
2021年10月,科大讯飞正式发布AI虚拟人交互平台,它具有多模感知、多维表达、情感贯穿、自主定义四大交互特点。可以在客户的不同业务场景下进行AI虚拟人赋能,提供一站式的AI虚拟人应用服务。
“科大讯飞推出的数字人目前已经开始把视觉、手势、视线和语音结合起来,实现数字虚拟人交互的多维表达。”吴晓如在接受21世纪经济报道等媒体采访时说道。