OpenAI升级ChatGPT 多模态AI实现文本图像无缝创作
3月26日,人工智能技术迎来重大突破。OpenAI于本周二宣布,其ChatGPT聊天机器人已升级为多模态AI系统,不仅能处理文本,还能根据复杂指令生成高质量图像,甚至整合语音、视频等交互方式。
此次升级让ChatGPT的创作能力大幅提升。例如,用户只需描述一个四宫格漫画的情节,包括角色设定和对话内容,AI就能迅速生成符合要求的完整漫画图像。相比此前版本,新版ChatGPT能更精准地理解并融合多样化概念,实现更富创意的视觉表达。
这一技术突破源于OpenAI最新模型GPT-4o的支持,它不仅强化了文本生成能力,还整合了图像、语音和视频处理功能,使AI能更自然地与用户互动。
值得注意的是,OpenAI此次并未采用传统的独立模块设计,而是将文本与图像生成技术深度融合。研究员加布里埃尔·吴(Gabriel Goh)表示:“我们不再将文本和图像视为独立任务,而是让AI协同学习,从而更灵活地应对复杂需求。” 在实际测试中,新版ChatGPT已能处理传统AI难以完成的创意任务,例如生成“三角形车轮的自行车”等非常规图像。
OpenAI表示,该功能已向所有用户开放,包括免费用户和订阅ChatGPT Plus(20美元/月)、ChatGPT Pro(200美元/月)的付费用户。此次升级标志着AI技术正从单一功能向全能型助手加速演进。