OpenAI升级ChatGPT 多模态AI实现文本图像无缝创作

2025-03-26 16:31:59 | 微观猎人 | 1042

3月26日，人工智能技术迎来重大突破。OpenAI于本周二宣布，其ChatGPT聊天机器人已升级为多模态AI系统，不仅能处理文本，还能根据复杂指令生成高质量图像，甚至整合语音、视频等交互方式。

此次升级让ChatGPT的创作能力大幅提升。例如，用户只需描述一个四宫格漫画的情节，包括角色设定和对话内容，AI就能迅速生成符合要求的完整漫画图像。相比此前版本，新版ChatGPT能更精准地理解并融合多样化概念，实现更富创意的视觉表达。

这一技术突破源于OpenAI最新模型GPT-4o的支持，它不仅强化了文本生成能力，还整合了图像、语音和视频处理功能，使AI能更自然地与用户互动。

值得注意的是，OpenAI此次并未采用传统的独立模块设计，而是将文本与图像生成技术深度融合。研究员加布里埃尔·吴（Gabriel Goh）表示：“我们不再将文本和图像视为独立任务，而是让AI协同学习，从而更灵活地应对复杂需求。” 在实际测试中，新版ChatGPT已能处理传统AI难以完成的创意任务，例如生成“三角形车轮的自行车”等非常规图像。

OpenAI表示，该功能已向所有用户开放，包括免费用户和订阅ChatGPT Plus（20美元/月）、ChatGPT Pro（200美元/月）的付费用户。此次升级标志着AI技术正从单一功能向全能型助手加速演进。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。