谷歌Gemini Live推出实时AI视频功能 可“看”屏幕内容并实时解答

2025-03-24 11:50:22   |   探索者   |   1605

3月24日,谷歌发言人亚历克斯・约瑟夫向The Verge证实,谷歌已开始向Gemini Live推送新的人工智能功能。这些功能使Gemini能够“看到”用户的屏幕内容,或通过智能手机摄像头获取画面,并实时回答相关问题。

据悉,这些功能基于谷歌去年5月在2024年I/O开发者大会上展示的“阿斯特拉项目”(Project Astra)。该项目是谷歌最新的多模态AI项目,能够本地运行在Pixel手机上,被视为对标OpenAI GPT-4o的最新模型。

谷歌表示,Project Astra可以直接解释用户摄像头画面中的物品,为用户提供更直观的交互体验。此次Gemini Live新功能的推出,标志着谷歌在多模态AI领域又迈出了重要一步。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

谷歌Gemini Live推出实时AI视频功能 可“看”屏幕内容并实时解答

2025-03-24 11:50:22 浏览量: 1605 作者: 探索者

3月24日,谷歌发言人亚历克斯・约瑟夫向The Verge证实,谷歌已开始向Gemini Live推送新的人工智能功能。这些功能使Gemini能够“看到”用户的屏幕内容,或通过智能手机摄像头获取画面,并实时回答相关问题。

据悉,这些功能基于谷歌去年5月在2024年I/O开发者大会上展示的“阿斯特拉项目”(Project Astra)。该项目是谷歌最新的多模态AI项目,能够本地运行在Pixel手机上,被视为对标OpenAI GPT-4o的最新模型。

谷歌表示,Project Astra可以直接解释用户摄像头画面中的物品,为用户提供更直观的交互体验。此次Gemini Live新功能的推出,标志着谷歌在多模态AI领域又迈出了重要一步。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号