新闻中心

通义万相新模型Wan2.2,上传图换视频角色,光影表情超逼真!

2025-09-24
浏览次数:
返回列表

近日,通义万相正式发布wan2.2 - animate模型,只需上传一张人物图像和一段视频,即可实现精准的动作复刻与角色替换。无论是让静态图片中的人物“跳起舞蹈”,还是在*后期中“更换主角”,都能生成媲美电影质感的动态效果,广泛适用于剧情魔改、*换人、创意短视频等多样化场景。

该模型依托四大核心技术实现关键突破。第一,采用统一架构设计。通过优化输入方式,将“图生动作”(Move模式)与“视频换人”(Mix模式)整合为同一符号体系,模型可根据输入内容自动识别并切换生成模式,无需分别训练两个独立模型,显著提升了开发效率与资源利用效率。

第二,实现表情与肢体的高精度控制。系统将控制信号拆解为两部分:身体动作通过VitPose提取2D骨骼信息,并注入初始噪声的潜在向量中,确保姿态迁移准确无误;面部表情则直接对参考视频中的人脸图像进行编码,生成帧级隐式潜在特征,借助时序对齐的交叉注意力机制进行注入,避免传统方法依赖人工关键点导致的细节丢失,从而真实还原眼神流转、嘴角微动等细腻表情。过去多数AI只能模仿大致动作,面部僵硬或失真严重,而如今Wan2.2能完整复现原视频中的情绪表达,使输出质量从“娱乐级”跃升至“专业电影级”。

第三,支持角色替换后的自然光影融合。在Mix模式中引入Relighting LoRA模块,基于IC-Light合成数据训练,可在保持角色外观不变的前提下,学习目标视频的光照环境与色彩风格,使新角色真正“融入”原场景,而非生硬“贴图”。即使面对带有运镜、晃动镜头的复杂视频,也能实现无缝衔接。以往常见的AI换人结果常因光影不匹配显得虚假,如同贴纸一般突兀;而通义此技术通过“光影重塑”能力,精准还原阴影方向、明暗过渡与色调一致性,视觉上几乎无法分辨真假,宛如实拍。

第四,全面开源完整工作流。团队开放了包括模板视频预处理代码(用于从驱动视频提取模板文件)以及模型推理代码(输入模板与角色图生成视频),极大降低了开发者调用门槛,助力更多姿态驱动类模型的效果提升与应用拓展。

Wan2.2 - Animate是在此前开源的Animate Anyone模型基础上全面升级而来,不仅在人物一致性、画面清晰度、动作流畅性等方面取得显著进步,更同时支持“动作迁移”与“角色替换”双模式。在动作迁移模式下,用户上传一张角色图片和一段动作视频,即可让图片中的人物复现视频中的动作与表情;在角色替换模式下,则可在保留原始视频动作、环境与镜头运动的基础上,将原有人物替换为目标角色。

GoEnhance GoEnhance

全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。

GoEnhance 347 查看详情 GoEnhance

为支撑这一模型的研发,通义万相团队构建了一个大规模人物视频数据集,涵盖说话、表情变化与全身动作等多种行为,并基于通义万相图生视频模型进行了深度后训练。目前该模型已可成功驱动真人、动漫形象乃至动物照片,广泛适用于短视频创作、舞蹈模板生成、动画制作等多个领域。

现阶段,用户可通过通义万相官网(国内站与国际站 https://www.php.cn/link/b532f0f8baa4651aac8ccd180dcba01d Face及GitHub三大平台开源,便于二次开发与创意落地。通义万相此次推出Wan2.2 - Animate,既以技术创新攻克了“看起来假”的行业难题,又以开源策略打破了“用起来难”的普及壁垒,真正推动AI视频生成迈向实用化新阶段。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

image

image

以上就是通义万相新模型Wan2.2,上传图换视频角色,光影表情超逼真!的详细内容,更多请关注其它相关文章!


# 好用  # 谈谈对seo的认识  # 怎么做笔趣阁网站推广  # 西昌短视频seo  # 衢州推广营销是什么  # 临沧抖音关键词排名加盟  # 黄陂企业猎头网站建设  # 句容营销型网站推广公司  # 普宁建设进度查询网站  # 网站权重优化论文怎么写  # 营销推广审批权限  # 贴纸  # 两月  # 的人  # 中国  # 通义万相  # 适用于  # 基础上  # 是在  # 上传  # 开源  # ai视频  # 二次开发  # 短视频  # ai  # 阿里云  # 编码  # github  # git 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 市盈率回落是什么意思  typescript如何使用viewer  m*en repository的作用是什么  python和typescript学哪个  ka是什么意思  电瓶车充电器power是什么意思  折叠屏手机哪款最好  ao3镜像网站永久地址入口  typescript是什么类型的语言  如何测试固态硬盘速度  电焊机power灯亮是什么意思  课程伴侣登不上怎么办  固态硬盘如何测试  typescript数据怎么写  单片机显存怎么设置最佳  苹果16改掉了哪些  宝马x5仪表盘上边有power是什么意思  j*a数组怎么比较abc  react怎么用typescript  双十一的哪一天最优惠呢  新装固态硬盘如何安装  焊机上power指示灯亮是什么意思  云笔记本电脑有什么用  怎么用typescript 写js  如何为服务器配置静态路由?服务器配置静态路由详细教程  春运哪天抢票最好预约  苹果16系统有哪些缺陷  苹果16系统有哪些问题  单片机面包板怎么插  每日推荐电声音乐软件有哪些  电脑type-c接口是什么意思  typescript多久能学会  复制 命令如何撤销  商誉是什么意思  哪个品牌有折叠屏手机卖  高市盈率是什么意思  cos150度等于多少  ai显示无法找到链接的文件是什么意思  如何4k对齐固态硬盘  照相机上面power是什么意思  折叠屏有哪些手机  苹果手机16系统有哪些  j*a map数组怎么取值  苹果16有哪些变化尺寸  交管12123协议头不完整怎么弄  a股等权平均市盈率是什么意思  driver是什么意思  2025年国外最佳语音聊天软件排行榜  drawing是什么意思  本科一批和本科二批是什么意思 

搜索