据了解,百度2021开发者大会将在希壤中举办,在其主办地Creator City中,用户便可听到周围人说话的声音,但不能100米外的窃窃私语。与此同时,百度方面发现,如果将众多声音混合,或出现类似白噪音式的声音。

国内首个元宇宙产品即将面向公众开放。12月21日,百度元宇宙产品“希壤-6.0版本”开放定向内测,可实现10万人同屏互动及真实声效还原。百度副总裁马杰表示,希壤版本号是一个负数,它距离我们所设想的目标还有巨大的成长空间。元宇宙发展是循序渐进的,将由整个社区花费很长时间共同构建并成熟。

马杰认为,在当前的网络技术条件下,视觉、听觉和交互是阻碍元宇宙发展的三座大山,面临着诸多严峻的技术挑战。

具体来看,在视觉方面,受限于硬件系统渲染能力、渲染时间及电池续航制约,3A游戏与科幻电影之间,至少存在千万倍的算力差距,这将直接影响观众的观看效果和沉浸体验。目前,业界距离制造像《头号玩家》电影中画面的拟真感任重道远。

以元宇宙终端设备之一VR头显举例,不管是VR的运行能力,还是制作360度仿真效果所需要的算力,都远不及3A游戏所依托的PC系统。在硬件设备暂时无法取得突破性创新的情况下,实现运算与显示的分离,云端渲染、高速传输、终端呈现,成为解决问题的关键。

与此同时,听觉也是元宇宙场景内的基础交互方式之一,并提供远近位置和空间线索。技术上需要利用空间音频及语音混音技术,模拟真实世界声音的时间差和声级差,使听觉层面具有空间感、层次感和沉浸感。所谓身临其境,主要来自于被动声音,如何合理的方式将被动声音融入到整个世界的听觉体系当中,是必须考量的因素。

据了解,百度2021开发者大会将在希壤中举办,在其主办地Creator City中,用户便可听到周围人说话的声音,但不能100米外的窃窃私语。与此同时,百度方面发现,如果将众多声音混合,或出现类似白噪音式的声音。

除视觉、听觉,动作也是用户间主要的交互方式。以Creator City为例,在模拟真实世界的情况下,10万名用户的一举一动都应传递给彼此。

然而,在技术层面,10万人在同一服务器内实时互动,每秒需要进行10万的平方数据传输,致使简单的数学问题演变成严峻的技术挑战。且这仅是一个交互动作所产生的数据量,如果将其放到一场持续至少一整天的大会中,几乎无以计数。

在马杰看来,解决元宇宙视觉、听觉和交互难题,除突破一系列技术瓶颈,还需要基础技术能力的支撑。主要包括安全、自主、智能的云计算技术;人工智能、ARM云、边缘计算、智能视频、VR和AR等领域不断创新;以及内容生态的建设与庞大的市场基础。

据悉,在元宇宙初期探索阶段,百度将以基础设施平台的形式参与元宇宙行业,为希壤以及其他元宇宙产品提供AI、云计算等技术。

百度高级副总裁侯震宇透露,为支持希壤超大量级的数据传输工程,百度AI原生云将为希壤提供PFLOPS级别的异构算力、数百GB的带宽资源以及可无限扩展的存储

 

来源:同花顺