谷歌Gemini Live推出实时AI视频功能可“看”屏幕内容并实时解答

2025-03-24 11:50:22 | 探索者 | 1605

3月24日，谷歌发言人亚历克斯・约瑟夫向The Verge证实，谷歌已开始向Gemini Live推送新的人工智能功能。这些功能使Gemini能够“看到”用户的屏幕内容，或通过智能手机摄像头获取画面，并实时回答相关问题。

据悉，这些功能基于谷歌去年5月在2024年I/O开发者大会上展示的“阿斯特拉项目”（Project Astra）。该项目是谷歌最新的多模态AI项目，能够本地运行在Pixel手机上，被视为对标OpenAI GPT-4o的最新模型。

谷歌表示，Project Astra可以直接解释用户摄像头画面中的物品，为用户提供更直观的交互体验。此次Gemini Live新功能的推出，标志着谷歌在多模态AI领域又迈出了重要一步。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。

谷歌Gemini Live推出实时AI视频功能 可“看”屏幕内容并实时解答

谷歌Gemini Live推出实时AI视频功能可“看”屏幕内容并实时解答