字节跳动 AI 助手豆包上线图片理解功能 一键“读图”解读更多信息
12月4日,字节跳动旗下 AI 助手豆包推出全新图片理解功能,进一步提升用户交互体验。根据最新更新,用户可通过豆包 App 或 PC 客户端新增的照片与相机按钮,上传图片以识别内容,享受智能化的“读图”服务。
豆包的图片理解功能能够快速识别图片中包含的元素和基本特征,并针对用户需求提供进一步信息。例如,用户上传某景点的照片后,豆包可识别并提供景点位置;上传影视截图,则可查询角色出处及相关影视作品信息。这一功能让图像内容的探索和应用更加便捷。
此次图片理解功能的推出,是豆包继视频生成功能内测后的又一技术突破。11月,豆包上线视频生成功能测试,支持用户将图片和文字一键转换为视频,并提供动态运镜、多镜头一致性及多样化风格比例选择,为内容创作带来了全新可能。
根据 IDC 于今年9月发布的移动端大模型应用市场竞争力分析报告,豆包在市场影响力、用户活跃度和用户粘性方面均表现优异。然而,由于其偏娱乐化的产品定位,用户对功能丰富度的要求较高,目前功能深度与体验上还有进一步提升空间。