【新智元导读】是不是《最伟大的作品》MV 首播瞬间你热血沸腾?在那之前,周董还曾和一位从平行宇宙穿越而来的虚拟人同台演出同样刷爆全网。
等了 6 年,周董《最伟大的作品》MV 首播,直接刷爆全网。
周杰伦一首钢琴曲化身时空旅人,瞬间回到了 1920 年代与艺术家们相遇。
杰迷们看后热血沸腾,纷纷等着数字专辑正式上线的那一刻。
不过,在那之前,周董就曾和一位特殊的粉丝「橙络络」同台演出。在熟悉的旋律中,网友们纷纷刷弹幕表示「爷青回」、「YYDS」、「全体起立」。
她穿着橙色连衣裙,伴随着轻快动感的旋律起舞,网友们为她纷纷打 CALL。
而刚刚所有这些数字人的实现,都是少不了一个看似「名不见经传」的公司——原数字科技股份有限公司。
在数字人的领域,字节跳动,腾讯,商汤、讯、OPPO、百度,甚至还有清华学等等,也都和这家公司展开了合作。
那么,这到底是什么神奇的魔力,让大厂们如此趋之若鹜呢?
就连 3D 技术首屈一指的英伟达,想临时起兴做一套模型,也是不行的。
之前提到的「假老黄」,便是由名为「The Scan Truck」的移动工作室制作出来的。我们熟知的「奇异博士 2」、「毒液」、「复仇者联盟:终局之战」等等,都有他们的参与。
现在,这种通过照相机整列采集的技术已经相当普及了。
为了得到更好的效果,原数字科技主研发设计了精度更高的重光照(光场)扫描软硬件系统,在性能上要远远超过传统的相机整列技术。
这套系统由主设计球形矩阵光照空间硬件和研数据算法软件组成,设计指标直接对标业界巨头谷歌的同类系统。
在这个直径 3.5 的球形矩阵光照空间中,原用 331 块主设计编程 LightForce 照明灯板来保证照明的绝对可控和同步,与此同时,还可以进行高达每秒 1000 次的光场变换。
更厉害的是,这些 RGB 灯珠还可以模拟出自然界中各种的光照情况。
采集端则搭载了 10 台速业相机以及 52 台单反相机,再配合上 LightForce 灯头的同步照明,系统便能以超的帧速率采集精度部动态何模型(点数达到百万级别)在不同光照环境下的数据。
在得到原始数据后,研的软件会调摄影何算法动成精度拓扑模型,并分离光,成精度达 8K 的颜图(Diffuse 贴图)、法线贴图(Normal)、光贴图(Specular)、以及次表散射图(Subsurface scattering 贴图)。
这一套流程下来,不管是演员表情、肌、褶皱、还是管等信息,都能被捕捉下来。
如此,不仅缩短了制作超精度写实数字的周期,简化了制作流程,而且还能最限度地还原演员表情精度和细节。
更进一步的,想实现超精度的部动态驱动,则必须得到连续的质量的 4D 数字部动态数据。
于是,原力在这套系统的基础上扩展开发了全新的 4D 扫描系统,实现了 高达每秒60 帧的精度3D 部动态数据采集。
除此之外,原已经开始利系统采集巨量体部数据,为今后进步利机器学习动成精度写实奠定了数据基础。
目前来说,业内一般采用的是面部捕捉的方式来采集面部动画的数据,例如 ARkit,Faceware,DynamicXYZ 等等。首先通过捕捉演员的表情动作,然后再映射到高精度的 3D 角色面部上。
就拿市面比较流行的商业软件 Faceware 和 DynamicXYZ 来说,需要大量的现场人工校准。
为了解决这一难题,原独创了套区别于传统 FACS(Facial Action Coding System)的表情编码系统。
借深度学习中编解码器(Autoencoder)的原理,研究人员设计使卷积络提取演员表演中的表情编码,并且在不同的人脸中实现表情编码的统一。
然后通过共享表情编码隐层空间向量,便可将演员表情直接解算到数字部绑定,进而实现了套基于神经络的三维部动画捕捉成算法。
基于此算法,原力完成了 OF_DeepFace 的开发——一套「标记点三维部动画制作流程」系统。
有了这套系统,你只需要套轻型红外摄像头盔或者普通 RGB 摄像头,就能实现从演员表演到超写实虚拟动画的实时转换。
既不用每帧模型做多摄像机体重建作,也不必动校正关键点与虚拟的部绑定,所有的工作都可以交给神经网络来完成。不仅实现了完全的自动化,顺便还节省了购置端摄像硬件设备的成本。
此外,由于结构轻便、推理效,这套自研的神经络可以兼容任意的部系统,包括前流的 MetaHuman 脸案。
而且,就算是在精度的三维模型上,OF_DeepFace 依然可以表现较的性能,实现实际帧率达到 60fps 以上的推理结果果。不管是从采集质量,使用便捷性,还是兼容性上,都全面超越了国外的同类软件。
事实上,原正是在此系统的基础上为很多客了实时直播的全新解决案。
除了面部表情的捕捉,很多场合是需要数字人能直接实时生成动画,而不能采用捕捉的方式,其中嘴部动画的生成也成为一个行业难题。
对此,原又拿出了自家的最新研发成果——从语(TTS)到部动画的直接成具 OF_DeepAudio。
经过海量数据训练,神经络可以从提取频特征,并解算出部控制器数值,动成然流畅的数字部动画。
话说回来,光靠神经网络还是不够的,由于原力使用了上面说到的表情编码系统,整个语音驱动的效果也更加的自然,并且可以在不同的面部之间转换,无需重新学习。
面部动起来了,那让这个数字人能够真正呈现给大家,能够实时渲染也很重要。这是交互式数字人和数字人直播的基础。
说白了就是如何高速驱动精度部模型成动画,也成为数字人流程中的技术难点之。
顺便提一句,驱动技术在动画制作领域的特定技术过程叫做「绑定」。而负责这项操作的技术人员通常会为制作极其复杂的绑定控件,以及修形变形器 BlendShape。
我们所熟知的虚幻引擎 MetaHuman 在打造数字人时,在部驱动部分的就是大量 BlendShape 的混合变形。
这样带来的问题是,变形节点非常复杂,如果要复原很写实的数字人表情,软件交互速度就会幅下降,后续生成的数字人也很难达到实时交互的速度,更不用说用在直播上了。
针对这痛点,原研发团队提出了种基于数据的构想:抛弃使各种变形器以及 BlendShape 的模式,直接机器学习神经络节点取代所有的变形计算。
基于上述思路,原研发团队研发出了套基于神经络的部绑定加速系统,以及模拟部肌运动的部实时绑定系统 OF_DeepRig。
OF_DeepRig 具可以动分析原始肌肉运动件,并动随机成海量训练数据进训练。训练完成后,原始件中的所有与绑定相关的计算,都会被个神经络定制节点取代,而所有的变形也都将转换为统一的表情编码系统下的参数。
这种方法可以完全复原任意的面部效果,唯不同是之前的脸驱动式幅提升了驱动速度。
OF_DeepRig 在引擎中运行速率(左)与原有绑定的运行速度(右)对比
同样的,这个神经络结构十分精简,在 3D 软件或者引擎中只有个计算节点,推理速度可以达到实时,即使场景中有多个,仍然能够在场景中实现部实时变形的效果。
此外,得益于原力研发的表情编码系统,还可以很方便的把人脸绑定效果迁移到其他不同的角色上。
目前,这项技术已经在腾讯,商汤,字节跳动,清华大学数字人的项目中得到了应用。
看到这,你是不是认为原力只是一家专注于做技术的公司呢?
目前,原 已经发展成为了国内最大 的 3D 数字内容和技术的企业之一,员工超过 2000 人。
除了之前提到的那些 国内外众多知名公司外 ,原力甚至还为现在最热的元宇宙公司 Meta 提供技术和服务。
经过在 3D 数字动画领域的期积累,原数字科技从 2016 年起,便开始在诸如计算机视觉和机器学习的主创新和技术研发上发。
在此过程中,套颠覆传统流程的超写实数字制作解决案应运而生。
不仅真正做到了替代期被国外垄断的多项核技术,而且还使效能产品质超写实数字成为可能。
也展出了条将智能以及智能计算理论成功应落地到数字领域的道路。
据公司 CEO 赵锐介绍,原力的目标就是在高端数字人的领域完全使用自研的科技,他坚信中国的技术一定可以超越国外。
她就是中国移动的橙络络,一个来自 2070 年的 AI 元气美少女。
作为动感地带全新品牌代言人的她,一出道便引发了全网热潮。
据统计,她在咪咕汇年度盛典的首秀全网总播放量累计高达 6.1 亿,斩获 11 个热搜,关键词冲榜 TOP 1。
橙络络的大获成功,背后离不开原力对其进行原创数字人 IP 的内容创制及深度的运营。
首先需要做充分的市场调研,搞清楚「新时代人群最喜爱 / 最期待的形象是什么样的」。
其后,基于此展开对虚拟人物和故事内容的文本设定,用更直白的话说,便是为其赋予更真实的生命。
这其中就包括了世界观搭建、人物小传开发、核心概念策划,以及故事总纲分纲的撰写等非常专业的内容创制环节。
例如,根据广泛的深度调研以及 B 站用户反馈,将橙络络设定为来自未来 2070 年的 AI 人工智能少女,同时具备瞬时传输、全息场景生成功能、以及超级脑存储功能等与品牌结合度更高的设定。
有了丰富准确的人物设定后,艺术家便可以开始非常关键的原画美术设计。再之后便是前文介绍的数字人 CG 资产制作、绑定、动作捕捉和训练。
它不仅具备了更强的定制化内容策划及制作能力,能够与品牌伙伴一道,为数字人 IP 共创出新鲜有趣、充满科技感、又能获得特定受众喜爱的平面及视频内容,而且根据品牌的整体策略为该内容定制各个社会化媒体平台的投放及运营策略。
可以看到,原力所展现出强大的虚拟直播以及大型现场 XR 表演的全流程制作及发布能力,橙络络与周董的首秀合作舞台便是最佳例证。
而开头我们提到的元宇宙新生代歌手李叙白,他的创制也同样由上面所提到的全流程体系所悉心打造。
后续,还有两支精彩视频将在本月内发布,相信能够再度惊艳行业同仁。
张苏粤表示,「根植于公司强大技术力的全流程创制体系,使我们在行业中独树一帜,让我们逐步建立起了团队独特的品牌和定位——为品牌打造全方位数字人 IP 资产,全面赋能品牌的创新营销策略。」
公司 CEO 赵锐补充说,「自研技术能为内容的传播提供更多支持,反之,优秀的内容创作还能反哺技术研发。」
原力作为国内最大的 3D 数字内容服务提供商,2200 多名员每天都在产和制作量的 3D 数据。
这些海量数据也成为原力在数字人领域能在技术和内容上都独树一帜的基础,数据促进技术的提升,新的技术也反哺了内容的创制。
这恰恰印证了,原力数字科技不仅是技术者,更是内容创作者。
未来,期待原力能够在技术和内容创作上继续大放异彩,带来更多亮眼的产品。
原文链接:https://baijiahao.baidu.com/s?id=1738035965729063386&wfr=spider&for=pc