谷歌推出增强版生成式AI工具Imagen 3和Gems定制机器人
近日,据报道,谷歌本周正在为其生成式人工智能工具带来新的升级,这些工具最初在Google I/O 2024大会上进行了预告。从本周开始,谷歌将推出其Imagen图像生成器的下一代版本,同时重新引入生成人物图像的功能。此外,谷歌的Gemini聊天机器人也将增加一个名为Gems的新功能,这是一种自定义指令机器人,类似于OpenAI的ChatGPT定制GPT。
Imagen 3是谷歌图像生成器的最新版本,被公司描述为“在图像质量上树立了新标准”。Imagen 3配备了先进的防护栏,旨在避免过度纠正多样性的问题,这类问题曾导致一些历史AI图像在网上引发争议。谷歌表示,Imagen 3在多项基准测试中的表现优于其他同类图像生成模型。
根据Gemini产品经理Dave Citron的介绍,Imagen 3允许用户在生成图像时添加附加提示,以便获得更精确的结果。此外,Imagen 3还集成了Google的SynthID工具,可以为生成的图像加水印,明确标识这些图片是人工智能生成的,而非真实照片。
尽管Imagen 3恢复了人物图像生成功能,但谷歌已采取措施防止生成“照片般逼真、可识别的人物”,以避免深度伪造等问题。儿童、暴力、血腥或性爱场景仍然被禁止生成。Dave Citron指出,这些改进旨在确保生成内容的安全性和道德性。
从本周开始,Imagen 3将向所有用户开放,而生成人物的功能将首先向付费用户提供。讲英语的Gemini Advanced、Business和Enterprise用户将在未来几天内可以使用此功能。
在Google I/O 2024大会上预览的Gems功能现在也即将推出。Gems是谷歌对OpenAI GPT技术的回应,旨在为用户提供个性化的聊天机器人体验。通过Gems,用户可以创建具备特定指令的定制机器人,用来应对各种挑战性任务。
Citron在新闻稿中表示:“通过Gems,你可以组建一个专家团队,帮助你思考复杂项目,为即将举行的活动集思广益,或者为社交媒体帖子撰写出色的标题。”Gems能够记住详细的指令,帮助用户节省在重复性、繁琐或困难任务上花费的时间。
Gems目前在桌面和移动设备上都可以使用,但仅适用于Gemini Advanced、Business和Enterprise订阅者。用户需要付费计划才能体验这些功能。