OpenAI将GPT-4O图像生成功能集成到ChatGPT，展示“令人难以置信的更好”结果

2025-03-26 74 其它文章

摘要

再见，dall-e。 Openai是在Chatgpt内部直接推出图像生成功能，这是使AI更有用的更广泛推动力的一部分。

币币情报道：

OpenAI宣布将其最新的图像生成功能直接集成到ChatGPT中，允许用户在无需离开聊天界面的情况下创建图像。这一功能标志着DALL·E 3的进一步演变，并代表了OpenAI在多模态AI模型领域的持续进步。

该功能于周二正式推出，是OpenAI推动其AI工具在不同媒体上更易用、更普及的一部分，同时巩固其在AI艺术领域的地位。

此前，OpenAI在同一平台上提供两种不同的模型：GPT用于文本生成，而DALL·E 3则专注于图像生成。然而，随着GPT-4O的升级，图像生成任务将完全由GPT-4O接管，DALL·E 3将逐步退出。

根据官方博客文章，GPT-4O在图像生成方面表现出色：“它能够准确渲染文本，精确遵循提示，并利用4O的固有知识基础和聊天环境中的上下文——包括转换上传的图像或将其用作视觉灵感。”

OpenAI首席执行官Sam Altman在一段展示GPT-4O新功能的视频中表示：“我们知道我们已经让您等待了，但我们认为这确实值得。我们认为您会喜欢它。”

在视频中，OpenAI展示了多个示例，包括解释相对论的漫画页面（支持英语和普通话输入）、基于个人照片的自定义交易卡、结合多个图像的纪念硬币设计，以及具有高度细节和长提示的复杂图像生成。

尽管生成速度较慢，但Altman强调，质量的显著提升值得等待。他表示：“图像生成速度比我们以前的模型慢得多，但结果令人难以置信地好。随着时间的推移，我们会让它更快。”

目前，该功能正在逐步推出，用户可以通过观察图像呈现方式来判断系统版本。与DALL·E 3不同，GPT-4O的图像会从上到下实时生成。

除了创造精美的图像外，这项技术还具备广泛的应用潜力。一位OpenAI研究科学家解释道：“这些模型现在可以‘看到’它们所知道的知识，并以视觉方式将其外部化。” 这为教育应用（如科学图表和信息海报）以及主题一致的图像编辑提供了可能性。

为了防止滥用，OpenAI实施了多项保护措施，包括防止生成深度伪造内容、非法内容和去除水印。虽然生成的图像没有可见水印，但它们包含C2PA元数据以标识为AI生成，同时公司正在开发跟踪图像来源的工具。

未来，OpenAI计划将这一功能引入其API，使开发者能够将技术集成到自己的应用程序中。使用条款明确规定，用户将保留其生成图像的所有权，但需遵守公司的使用政策。

编辑：塞巴斯蒂安·辛克莱（Sebastian Sinclair）和乔什·奎特纳（Josh Quittner）

币币情登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

热门新闻

交易平台最新公告查看更多>

成交额排行榜