新闻中心
魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话
魔搭社区推出了一款名为live portrait的ai视频生成工具,能够通过一键操作使照片中的人物开口说话
阿里云推出了一项名为Live Portrait的数字人视频生成工具,用户只需上传一张照片和一段文本或语音,即可生成一段开口说话的数字人视频。这项工具可应用于视频|直播|、聊天机器人、企业营销等多个场景。目前,该工具已在魔搭社区创空间开放体验
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

随着自对话大模型和AI绘画模型的风靡,研究界正逐渐将生成式AI的研究推向更多模态的方向,其中AI视频生成技术备受关注。该技术能够将文本或音频等信息转化为面部运动信息,从而生成具有人物形象的动画照片,有效降低了视频拍摄和制作的门槛
阿里云最新上线的Live Portait工具,结合了
运动模块和生成模块。该工具采用了阿里云自研的口型预测算法,大幅提高了口型生成的准确度,相较于传统方法有显著提升。在训练阶段,增加了姿态的显式控制,使得生成的视频可以呈现任意动作,无需底板视频,从而大幅提升了数字人说话的真实感。此外,通过眼神主动控制技术,Live Portait可以为眼球增加自然运动,使得生成结果更加接近真人效果。据介绍,Live Portait相关技术已被国际AI顶会CVPR、ICCV等收录

Tome
先进的AI智能PPT制作工具
143
查看详情
根据魔搭社区的信息,Live Portait提供了两种方式供用户选择上传照片后,即文本驱动和音频驱动。在文本驱动模式下,用户可以选择28种不同的声音,包括普通话、英语、粤语和童声等。此外,Live Portait还提供了轻量模型选择,以帮助用户更快地生成视频
张邦,该工具算法负责人,表示:“Live Portait整合了团队多项自主研发的创新技术,包括利用单张图片即可生成逼真的面部动画,突破了传统对抗生成网络的限制。随着技术的不断演进,图像生成视频具有广阔的应用前景,有望成为企业提高生产效率、降低成本的重要工具。”
据了解,该团队的研究方向包括数字人、3D模型AI生成、高逼真渲染和自然人机交互等领域,已经在国际顶级会议上发表了50多篇论文
以上就是魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话的详细内容,更多请关注其它相关文章!
# 广州市移动网站建设方案
# 外贸网站谷歌优化价格
# 融水网络推广营销
# php网站优惠seo
# 清远网站建设做网站公司
# 安阳网络营销推广获客
# 迪庆如何优化网站设计图
# 广东百度推广网站平台
# 林州网站建设教程
# 网站建设报价模板范文
# 一键
# 中文网
# 相关文章
# 据了解
# 只需
# 已被
# 两种
# 多个
# 粤语
# 推出了
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
征信不好如何短期恢复
固态硬盘损坏如何修复
typescript怎么写游戏
1tb等于多少mb
meet是什么意思
typescript中如何引入本地js
5G类似微信的聊天软件有哪些
广东春运抢票怎么抢的
苹果16更新了哪些功能
单片机怎么发送can 信号
一年多少周
电脑如何查看固态硬盘
电焊机power和oc是什么意思
access中如何使用常用宏命令
苹果16哪些功能好用
nosql数据库的应用场景有哪些
oppo手机nfc功能是什么意思
怎么自学typescript
所有删除的聊天记录都可以恢复吗?
typescript有什么框架
国标控制器单片机怎么接线
如何安装固态硬盘win10
typescript是什么类型的语言
摩托车上power是什么意思
为什么学typescript
市盈率静是什么意思
折叠屏手机共有哪些
单片机怎么控制内功率
哪些库是typescript
360n7lite怎么设置动态壁纸
manager是什么意思
如何操作fixup命令
命令行ftp如何创建目录
关系型数据库和非关系型数据库有哪些
如何清理固态硬盘
路由器power灯一直亮是什么意思
43寸电视长宽多少厘米
命令行如何打开文件
折叠手机内屏为什么会坏
照相机上面power是什么意思
对象数组怎么用j*a
汽车上power是什么意思
折叠屏手机为什么凉凉
广东春运抢票怎么抢不到
typescript怎么写call方法
夸克学习都有什么课程
i5 6500怎么装win7
为什么夸克网盘下载不了
市盈率亏损是什么意思
命令行如何运行c


2023-08-19
浏览次数:次
返回列表