阿里巴巴公布图生视频专利 可实现智能化端到端图生视频

2025-02-08 17:20:01   |   探索者   |   134

天眼查知识产权信息显示,近日,阿里巴巴(中国)有限公司申请的“一种图生视频方法和装置”专利公布。

摘要显示,本发明实施例将包含目标对象的源图像输入第一视频生成模型得到素材视频,根据素材视频确定帧间变换矩阵序列,然后从源图像中得到目标对象对应的对象掩码图像,将帧间变换矩阵序列应用于对象掩码图像可得到多张掩码图像从而组成掩码图像序列,将帧间变换矩阵序列应用于源图像可得到多张目标对象图像从而组成目标对象图像序列,根据源图像、掩码图像序列和目标对象图像序列确定目标输入数据,将目标输入数据输入支持局部重绘的第二视频生成模型,得到对应的目标视频。通过两次模型生成视频,实现了智能化端到端的图生视频,无需引入预设运动参数即可在保持目标对象不扩散的同时,实现运动轨迹多样性。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

阿里巴巴公布图生视频专利 可实现智能化端到端图生视频

2025-02-08 17:20:01 浏览量: 134 作者: 探索者

天眼查知识产权信息显示,近日,阿里巴巴(中国)有限公司申请的“一种图生视频方法和装置”专利公布。

摘要显示,本发明实施例将包含目标对象的源图像输入第一视频生成模型得到素材视频,根据素材视频确定帧间变换矩阵序列,然后从源图像中得到目标对象对应的对象掩码图像,将帧间变换矩阵序列应用于对象掩码图像可得到多张掩码图像从而组成掩码图像序列,将帧间变换矩阵序列应用于源图像可得到多张目标对象图像从而组成目标对象图像序列,根据源图像、掩码图像序列和目标对象图像序列确定目标输入数据,将目标输入数据输入支持局部重绘的第二视频生成模型,得到对应的目标视频。通过两次模型生成视频,实现了智能化端到端的图生视频,无需引入预设运动参数即可在保持目标对象不扩散的同时,实现运动轨迹多样性。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号