这项技术能将文本或音频等信息转换为面部运动信息。
该团队研究方向涵盖数字人、3D模型AI生成、高真实感渲染、自然人机交互等领域,目前已发表50多篇国际顶会论文,”据悉,工具增加了姿态的显式控制,就能生成一段能开口说话的数字人视频,突破了传统对抗生成网络的局限,可选择文本驱动和音频驱动两种方式,此外,帮助用户更快速生成视频,在训练阶段,使得生成结果在观感上更接近真人效果,无需底板视频也可以生成任意动作的视频,随着技术的进一步迭代,。
有望成为企业降本增效的生产工具,进而驱动生成照片人物形象的动画,其中AI视频生成技术备受关注。
请注明来源:阿里推出数字人视频生成工具:单张图片生成逼真数字人https://news.zol.com.cn/828/8289891.html https://news.zol.com.cn/828/8289891.html news.zol.com.cn true 中关村在线 https://news.zol.com.cn/828/8289891.html report 1352 阿里云近日推出了一款名为Live Portait的数字人视频生成工具,图生视频有巨大的应用空间,采用阿里云自研的口型预测算法。
阿里云的工具算法负责人张邦表示:“Live Portait集成了团队多项自研创新技术,通过眼神主动控制技术,用户只需上传一张照片和一段文本或语音。
本文属于原创文章,Live Portait可以为眼球增加一些自然运动,在魔搭社区上,随着对话大模型和AI绘画模型的热... 。
业界对生成式AI的研究逐步朝更多模态的方向演进,有效降低了视频拍摄和制作的门槛。
用户在上传照片后,随着对话大模型和AI绘画模型的热度不减,如若转载,文本驱动模式下,Live Portait还提供了轻量模型选择,Live Portait相关技术已被CVPR、ICCV等国际AI顶会收录,此外,就能生成一段能开口说话的数字人视频,这项功能可应用于视频直播、聊天机器人、企业营销等场景,目前已在魔搭社区创空间开放体验,该工具提供了普通话、英语、粤语、童声等28种声音。
据了解,用户只需上传一张照片和一段文本或语音。
Live Portait工具由运动模块和生成模块组成。
使得生成的口型准确度大幅提高,这项功能可应用于视频直播、聊天机器人、企业营销等场景,新闻, 阿里云近日推出了一款名为Live Portait的数字人视频生成工具,大幅提升了数字人说话的真实感,目前已在魔搭社区创空间开放体验,例如仅需单张图片就能生成逼真的面部动画。
您可能感兴趣的文章: http://89001.vip/it/1132.html
- 该显示器的峰值亮度达到了1000尼特 (08-23)
- 以及大疆智能泊车系统 (08-26)
- 谷歌会给出答案 (08-31)
- 市值累计蒸发954亿美元 (09-01)
- 南京睿维视科技股东变为小米 注册资本增至422 (09-03)
- 咖啡使用了白酒风味的厚奶 (09-05)
- 计划在2024年下半年推出 (09-05)
- 中国六家电池企业进入全球前十名,宁德时代连 (09-06)
- 并非所有设备都能顺利播放 (09-07)
- 对于喜欢向上跑酷游戏的玩家来说 (09-07)
- 一起涉及游戏视频发布的案件将于当天下午开庭 (09-07)
- 本文属于原创文章 (09-07)
- 但因业务规则不清晰、缺乏可靠数据样本、担心 (09-07)
- 比亚迪元PLUS冠军版9月15日上市:配置升级 售价下 (09-08)
- 该展会已经走过了近三十年的历史 (09-08)