DeepMind 发布 Genie 2 模型 可生成互动 3D 游戏世界

2024-12-05 11:56:54   |   唐薇   |   1962

12月5日,谷歌旗下的人工智能研究机构 DeepMind 本周发布了其全新的 Genie 2 模型,作为 Genie 模型的升级版,Genie 2 允许用户通过简单的文字描述和图片生成“无限”种类的可玩 3D 世界,进一步推动了人工智能在虚拟环境创作中的应用。

Genie 2 模型具备强大的生成能力,能够根据用户的文本提示和图像输入,实时生成高度交互式的三维场景。例如,用户只需输入“森林中的可爱人形机器人”,该模型便能构建出一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作机器人,在虚拟世界中进行跳跃、游泳等互动行为。

DeepMind 表示,Genie 2 不仅能够生成 3D 环境,还可以创建不同视角下的连贯世界,如第一人称视角或等距视角,生成的场景可以持续长达 一分钟,大多数场景则持续 10 到 20 秒。

与传统的虚拟世界生成模型不同,Genie 2 在图像质量和物理效果上取得了显著进步。生成的场景画质接近 AAA 级别 的电子游戏,特别是在物体交互、动画、光照、物理反射以及非玩家角色(NPC)的行为模拟方面表现出色。DeepMind 强调,Genie 2 在场景记忆和一致性方面表现优异,能够在场景中正确渲染不可见的部分,并在它们重新出现在视野范围内时精确渲染。

虽然市面上也有类似的世界模型,如 World Labs 和 Decart 的产品,但这些模型通常存在伪影、场景一致性不足和幻觉等问题。例如,Decart 的 Minecraft 模拟器 Oasis 在生成过程中存在分辨率低的问题,并且很快会“忘记”关卡布局。然而,Genie 2 可以有效避免这些问题,准确渲染远离视野的场景,保持环境的一致性和连贯性。

尽管 DeepMind 没有详细披露 Genie 2 的训练数据来源,但业内普遍猜测,这款模型可能依赖于大量热门游戏的游玩数据,尤其是 YouTube 上的视频内容。谷歌在使用其平台内容进行训练方面声称拥有相应的权限,这引发了外界关于是否涉及知识产权侵犯的讨论。

目前,利用 Genie 2 创建的游戏尚不够完整且互动性有限,通常每隔一分钟游戏进度会被重置。因此,DeepMind 目前将其定位为 研究与创意工具,主要应用于快速原型设计和 AI 智能体评估 等场景。DeepMind 表示,Genie 2 能够将概念艺术和手绘草图转化为完全互动的虚拟环境,为未来的任务场景评估提供有力支持。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

DeepMind 发布 Genie 2 模型 可生成互动 3D 游戏世界

2024-12-05 11:56:54 浏览量: 1962 作者: 唐薇

12月5日,谷歌旗下的人工智能研究机构 DeepMind 本周发布了其全新的 Genie 2 模型,作为 Genie 模型的升级版,Genie 2 允许用户通过简单的文字描述和图片生成“无限”种类的可玩 3D 世界,进一步推动了人工智能在虚拟环境创作中的应用。

Genie 2 模型具备强大的生成能力,能够根据用户的文本提示和图像输入,实时生成高度交互式的三维场景。例如,用户只需输入“森林中的可爱人形机器人”,该模型便能构建出一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作机器人,在虚拟世界中进行跳跃、游泳等互动行为。

DeepMind 表示,Genie 2 不仅能够生成 3D 环境,还可以创建不同视角下的连贯世界,如第一人称视角或等距视角,生成的场景可以持续长达 一分钟,大多数场景则持续 10 到 20 秒。

与传统的虚拟世界生成模型不同,Genie 2 在图像质量和物理效果上取得了显著进步。生成的场景画质接近 AAA 级别 的电子游戏,特别是在物体交互、动画、光照、物理反射以及非玩家角色(NPC)的行为模拟方面表现出色。DeepMind 强调,Genie 2 在场景记忆和一致性方面表现优异,能够在场景中正确渲染不可见的部分,并在它们重新出现在视野范围内时精确渲染。

虽然市面上也有类似的世界模型,如 World Labs 和 Decart 的产品,但这些模型通常存在伪影、场景一致性不足和幻觉等问题。例如,Decart 的 Minecraft 模拟器 Oasis 在生成过程中存在分辨率低的问题,并且很快会“忘记”关卡布局。然而,Genie 2 可以有效避免这些问题,准确渲染远离视野的场景,保持环境的一致性和连贯性。

尽管 DeepMind 没有详细披露 Genie 2 的训练数据来源,但业内普遍猜测,这款模型可能依赖于大量热门游戏的游玩数据,尤其是 YouTube 上的视频内容。谷歌在使用其平台内容进行训练方面声称拥有相应的权限,这引发了外界关于是否涉及知识产权侵犯的讨论。

目前,利用 Genie 2 创建的游戏尚不够完整且互动性有限,通常每隔一分钟游戏进度会被重置。因此,DeepMind 目前将其定位为 研究与创意工具,主要应用于快速原型设计和 AI 智能体评估 等场景。DeepMind 表示,Genie 2 能够将概念艺术和手绘草图转化为完全互动的虚拟环境,为未来的任务场景评估提供有力支持。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号