Google DeepMind 近日向部分用户开放了全新的 AI 模型 Project Genie。这款工具突破了传统内容生成的边界,让用户仅通过简单的文本描述或上传一张静态图片,就能即时构建出可交互的虚拟世界,并像玩电子游戏一样在其中自由探索。
Project Genie 的背后是多种顶尖 AI 技术的融合。它以 Genie3 模型为基础,结合了 Nano Banana Pro 图像生成模型以及 Gemini 多模态模型。通过这一组合,系统能够将自然语言提示词转化为沉浸式互动场景,无论是驾驶飞船掠过异星行星,还是在亚马逊雨林中奔跑,都能快速成型。
主要功能
- 世界草图绘制:输入文字或上传图片创建世界,借助 Nano Banana Pro 预览效果并调整,选定第一或第三人称视角后即可进入。
- 世界探索:支持操控角色在环境中移动,系统会实时生成前方场景,可随时调整镜头角度。
- 世界重混:支持在画廊浏览他人作品获取灵感,修改提示词重新创作,或随机生成新世界,最后可下载探索视频。
如何使用
- 访问官网:访问Project Genie官网,点击”Explore now”按钮进入(需 Google AI Ultra 订阅权限)。
- 创建世界:在文本框输入世界描述(如”赛博朋克城市”),或上传参考图片,点击生成预览。
- 调整预览:Nano Banana Pro 会生成静态预览图,用户可修改提示词或图片细节,直到满意为止。
- 选择视角:在预览界面选择第一人称或第三人称视角,确定角色观察方式。
- 进入探索:点击确认进入实时生成的世界,用键盘/鼠标操控角色移动。
- 实时漫游:行走、飞行或驾驶时,Genie 3 会随用户移动即时渲染前方场景。
- 调整镜头:探索过程中可随时缩放或旋转视角,调整观察角度。
- 重混创作:返回画廊选择他人作品,修改原提示词生成新版本,或点击随机按钮获取灵感。
- 保存分享:完成探索后,点击下载按钮保存世界视频到本地。
应用场景
- 创意娱乐:游戏开发者可快速生成虚拟世界原型,玩家能创建、探索个性化的互动场景。
- 影视动画:导演和艺术家可用预览可视化场景、生成概念环境,降低前期制作成本。
- 建筑设计:建筑师能让客户在未建成前漫游空间,直观感受布局与氛围。
- 教育培训:教师可重现历史场景或科学现象,让学生身临其境地进行虚拟考察。
- 机器人研究:研究员能生成多样化物理环境,为智能体训练提供无限测试场景。
仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!
链接: https://fly63.com/nav/4917