摘要:OpenAI近期在ChatGPT中引入了一项革命性的新功能——图像生成。这一变化得益于其先进的GPT-4o多模态模型,使得ChatGPT用户现在可以直接在聊天界面中创建图像。
OpenAI近期在ChatGPT中引入了一项革命性的新功能——图像生成。这一变化得益于其先进的GPT-4o多模态模型,使得ChatGPT用户现在可以直接在聊天界面中创建图像。
据悉,这一新功能将率先向ChatGPT Plus、Pro、Team以及免费用户开放,而企业和教育级别的用户也将很快获得使用权限。OpenAI的首席执行官Sam Altman在周二的一场视频直播中激动地表示,他们推出了迄今为止最有趣、最酷的产品之一——直接在ChatGPT中生成原生图像。
Altman坦诚,这一功能备受用户期待,特别是在竞争对手如Google Gemini自2024年年中便开始提供集成图像生成功能的大背景下。现在,ChatGPT用户可以根据提示、对话内容以及上传的文件来生成图像,无论是创造全新的图像还是对现有图像进行转换,都变得轻而易举。
OpenAI强调,GPT-4o模型中的世界知识训练使得ChatGPT能够更好地理解图像的应用场景。该模型还能更准确地根据提示在图像中呈现文本。用户可以通过自然语言提示来优化图像,例如在设计视频游戏角色时,模型可以在用户进行多次调整后,依然保持视觉的一致性。
OpenAI希望用户能够利用这一工具来制作各种需要精确度的专业图像,如图表、信息图表和品牌内容,同时也适用于文字较多的图像,如说明海报和名片。它还能生成具有精确灯光和纹理的逼真图像,以及受益于对话背景的视觉效果。
为了简化流程,OpenAI使用了单一的多模式模型来处理所有的图像生成任务,从而将ChatGPT定位为个人和专业图像生成的首选工具。这一创新不仅提升了用户体验,也进一步巩固了OpenAI在人工智能领域的领先地位。
来源:ITBear科技资讯