科普时报记者陈杰

刚刚结束的2024年全国虚拟数字人记者成报道段,吸引了公众的目。“他们”形象靓丽仪态大方语音流畅,不仅能够对镜头播报新闻,有些还能与代表、委员对话们不禁好,这些虚拟数字记者是如何生成的?

多种计算机前沿技术共同“塑造”数字人

南京航空航天大学计算机科学技术学院人工智能学院教授李博介绍,虚拟数字人是元宇宙接地气、最先落地的技术之一,也是一种基于计算机前沿技术应用。在技术上,生成虚拟数字人一般采自然语言处理多模态融合交互扩展现实XR大模型等技术和工具相结合。最终开发设计出来的可交互虚拟形象,具备人类外观表情语言和行征。

在生成虚拟数字人的这些底层技术中,自然语言处理技术使得数字人能够理解和生成人类语言;多模态融合交互技术语音手势触摸凝视等多种形式的输入与虚拟数字人交互;扩现实技术是通过计算机将真实与虚拟相结合,创造出可人机交互虚拟环境;大模型技术则是基于大量语料或图像训练得到的参数量模

“通过控制模型参数,我们就可以调整虚拟字人的外观、表情等征,创造出具有逼真外且有一定智能的虚拟数字人。”李博涵说。

将为人们的生活来全新体验

目前,虚拟数字人已经具有广泛应用场景。除了新闻报外,虚拟数字人还活跃在影视媒体游戏文旅等领域,被创作虚拟角色打造专属虚拟形象IP,比如世界第一使用全息投影技术举办演唱会虚拟偶像“初音未来”。

此外,虚拟数字人在虚拟客服教育培训医疗保健虚拟购物以及艺术作等领域都有一定的使用。例如,清华大学机系的虚拟学生冰”会写诗作曲语解说数字人“聆语”担任了多冬奥会赛事的手语解说。在第12届世界唐氏综合征日大会上亮相的数字人“皓皓”,能够模拟真实的人际交往,帮助唐氏综合征患儿打开扉。同时,也有一些企业尝试虚拟数字人主播代替真人主播进行带货、团商业活动

“现在这些领域的应用场景还相对固定,而且虚拟数字人本身内在的情感表达和创造力暂时还比较缺乏。但是,凭借丰富的表现力、突出的互动性,相信虚拟数字人未来会为人们的生产生活带来了全新体验。”李博涵预测,随着大模型生成能力的不断提升,未来虚拟数字人将变得更加逼真、智能和具备情感表达能力,也会更加广泛深度地进入到我们的日常生活。例如,可能代表人类在会议社交等不同场景中进行互动,甚至成为人们的另一种数字孪生

当然,未来人们对于虚拟数字人的接受度,以及道德法律等方的考量,还有待更深入的研究和讨论。

 

 

文章来源科普时报-河北科学技术厅

https://kjt.hebei.gov.cn/www/kxpj22/kxbl56/300610/index.html