新闻中心
五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频*要防不住了
如此强大的AI模仿能力,真的防不住,完全防不住。现在AI的发展已经达到了这种程度吗?
你前脚让自己的五官乱飞,后脚,一模一样的表情就被复现出来,瞪眼、挑眉、嘟嘴,不管多么夸张的表情,都模仿的非常到位。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
加大难度,让眉毛挑的再高些,眼睛睁的再大些,甚至连嘴型都是歪的,虚拟人物头像也能完美复现表情。

当你在左侧调整参数时,右侧的虚拟头像也会相应地改变动作

给嘴巴、眼睛一个特写,模仿的不能说完全相同,只能说表情一模一样(最右边)。

这项研究来自慕尼黑工业大学等机构,他们提出了 GaussianAvatars,这种方法可用来创建在表情,姿态和视角( viewpoint )方面完全可控的逼真头部虚拟( head *atars)。

- 论文地址:https://arxiv.org/pdf/2312.02069.pdf
- 论文主页:https://shenhanqian.github.io/gaussian-*atars
在计算机视觉和图形学领域,创造出能够动态展现人类虚拟头部一直是一个具有挑战性的问题。特别是在表现极端面部表情和细节方面,例如皱纹和头发等细节的捕捉相当困难,生成的虚拟人物往往会出现视觉伪影的问题
在过去的一段时间里,神经辐射场(NeRF)
及其变种已经在从多视图观察中重建静态场景方面取得了令人印象深刻的成果。随后的研究扩展了这些方法,使得NeRF能够用于人类定制场景的动态场景建模。然而,这些方法的一个缺点是缺乏可控性,因此无法很好地适应新的姿态和表情
最近出现的「3D高斯喷洒」方法实现了比NeRF更高的渲染质量,可用于实时视图合成。然而,该方法不支持重建输出的动画
本文提出了 GaussianAvatars,这是一种基于三维高斯 splats 的动态 3D 人头表示方法。
具体而言,给定一个 FLAME(对整个头部进行建模)网格 ,他们在每个三角形的中心初始化一个 3D 高斯。当将 FLAME 网格动画化时,每个高斯模型都会根据其父三角形进行平移、旋转和缩放。然后,3D 高斯在网格顶部形成辐射场,补偿网格未准确对齐或无法再现某些视觉元素的区域。
为了保持虚拟人物的高度真实感,本文采用了绑定继承策略。同时,本文还研究了如何在保持真实感和稳定性之间取得平衡,以实现虚拟人物的新颖表情和姿态动画化。研究结果显示,与现有研究相比,GaussianAvatars在新颖视图渲染和驾驶视频重现等方面表现出色

方法简介
如下图 2 所示,GaussianAvatars 的输入是人头的多视图视频记录。对于每个时间步,GaussianAvatars 使用光度头部跟踪器(head tracker)将 FLAME 参数与多视图观察和已知相机参数相匹配。

FLAME 网格的顶点位置各不相同,但拓扑结构相同,因此研究团队可以在网格三角形和 3D 高斯splat之间建立一致的连接。利用可微分的图块光栅器(tile rasterizer)将splat渲染成图像。然后,通过真实图像监督,学习逼真的人体头部头像
为了获得最佳质量,静态场景需要通过一组自适应密度控制操作来紧凑和修剪高斯splat。为了实现这一点,研究团队设计了一种绑定继承策略,使新的高斯点与FLAME网格保持绑定,同时不破坏三角形和splat之间的连接
实验结果
该研究使用新的视角合成技术来评估重建质量,并通过自我复现来评估动画的保真度。下图3显示了不同方法之间的定性比较结果。在新的视角合成方面,所有的方法都能够产生合理的渲染结果。但是,通过仔细检查PointAvatar的结果,可以发现由于其固定的点大小,会出现点状伪影。而采用3D高斯各向异性缩放技术的GaussianAvatars则能够缓解这个问题

我们可以从表1的数量比较中得出相似的结论。与其他方法相比,GaussianAvatars在新视图合成方面表现出色,self-reenactment方面也很出色,在LPIPS方面感知差异明显降低。需要注意的是,self-reenactment是基于FLAME网格跟踪的,可能无法完全对齐目标图像

为了测试虚拟形象动画在现实世界中的表现,该研究进行了图4中的跨身份再现实验。结果显示,虚拟形象准确地再现了源演员的眨眼和嘴巴动作,呈现出活泼复杂的动态,如皱纹等


为了验证方法组件的有效性,该研究还进行了消融实验,结果如下图。

以上就是五官乱飞,张嘴、瞪眼、挑眉,AI都能模仿到位,视频*要防不住了的详细内容,更多请关注其它相关文章!
# 智能
# 都能
# 住了
# 高斯
# 角形
# 绑定
# 三大
# 数据
# 网站的建设顺序
# 武汉自助网站建设运营
# 究竟什么是SEO
# 新开网站推广怎么做
# 惠州网站优化推广多少钱
# 南康区推广网络营销
# 大连网站视频推广软件下载
# 武进百度推广招聘网站
# 凯里推广网站
# 东阳seo优化教学
# 个月
# 首款
# 将于
# 提出了
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
typescript能开发什么
交管12123协议头不完整怎么解决
j*a怎么让数组倒换
喇叭上POWER4欧是什么意思
复制 命令如何撤销
华为如何面对苹果16
苹果16有哪些自带配件
如何查看电脑的固态硬盘
混合固态硬盘如何分区
金色cmyk色值是多少
typescript和node学哪个
angluar如何命令删除dist
mysql的datediff函数怎么用
市盈率pe是什么意思
分销是什么意思
NoSQL数据库有哪些特点
为什么要出折叠屏手机
typescript怎么写游戏
如何查看固态硬盘速度
为什么夸克网盘下载不了
春运抢票哪个城市好抢
苹果16会升级哪些
五十铃x-power是什么意思
电脑显示器上power是什么意思
启辰星power标志是什么意思
typescript和哪个语音很像
如何用命令行连接本地数据库
一尺是多少厘米
单片机怎么发送can 信号
单片机怎么储存和显示
广东春运抢票怎么抢的
夸克高考为什么不靠谱
闪光灯power闪烁是什么意思
迅达热水器显示power是什么意思
typescript怎么判断单选按钮
如何使用net命令
access 如何输入命令
苹果16哪些型号好
固态硬盘如何安装win10系统安装
什么是夸克模组文件格式
怎么下载360桌面壁纸
市盈率亏损是什么意思
安卓手机怎么打开5g
python如何命令行换行
driver是什么意思
命令不执行如何处理
typescript适合什么用
油电混动车仪表盘上的power是什么意思
typescript学会要多久
为什么ai老是说链接面板中缺少某些文件


2023-12-14
浏览次数:次
返回列表