Sora刷屏视频出现多处失误OpenAI回应:正在积极改进
近日,据外媒报道,Sora所生成的视频内容已经得到了影视行业人士的普遍认可。许多人认为,虽然Sora在视频画质、细节、光影和色彩等方面表现出色,但在涉及镜头运动角度和更精细内容调控方面仍存在不足。
一位纪录片从业者表示,目前Sora还不能直接用于影视作品,因为其精细度还不够。然而,他也认为Sora已经足够震撼,完全可以用于前期开发,尤其是概念设计。
在直观感受上,Sora模型产出的视频运镜自然,物体运动符合规律,镜头间逻辑一致性好,但逻辑性会差一点。具体表现在Sora视频内容中,如一分钟的东京街头女郎漫步场景中,女郎走路过程中存在腿部变形、腿部交叉换位时错乱等错误。
Sora是一种基于深度学习的视频生成模型,它可以根据用户输入的文本或语音提示,自动合成出高质量的视频内容。Sora的核心技术是OpenAI的大规模自监督语言模型GPT-3,它可以理解自然语言,并将其转化为视频序列。Sora的目标是成为一个世界模拟器,能够为用户提供各种可能的场景和体验。
针对目前Sora存在的不成熟之处,OpenAI方面表示承认并正在积极改进。他们在《作为世界模拟器的视频生成模型》技术报告中坦诚地指出了Sora作为模拟器的许多限制,如难以准确模拟复杂场景的物理原理、无法理解因果关系、可能混淆提示的空间细节等。OpenAI表示将继续努力提升Sora的性能和精度,以期在未来为影视行业带来更多创新和突破。