OpenAI将GPT-4O图像生成功能集成到ChatGPT,展示“令人难以置信的更好”结果

2025-03-26 40 其它文章
摘要
再见,dall-e。 Openai是在Chatgpt内部直接推出图像生成功能,这是使AI更有用的更广泛推动力的一部分 。
币币情报道:

OpenAI宣布将其最新的图像生成功能直接集成到ChatGPT中,允许用户在无需离开聊天界面的情况下创建图像。这一功能标志着DALL·E 3的进一步演变,并代表了OpenAI在多模态AI模型领域的持续进步。

该功能于周二正式推出,是OpenAI推动其AI工具在不同媒体上更易用、更普及的一部分,同时巩固其在AI艺术领域的地位。

此前,OpenAI在同一平台上提供两种不同的模型:GPT用于文本生成,而DALL·E 3则专注于图像生成。然而,随着GPT-4O的升级,图像生成任务将完全由GPT-4O接管,DALL·E 3将逐步退出。

根据官方博客文章,GPT-4O在图像生成方面表现出色:“它能够准确渲染文本,精确遵循提示,并利用4O的固有知识基础和聊天环境中的上下文——包括转换上传的图像或将其用作视觉灵感。”

OpenAI首席执行官Sam Altman在一段展示GPT-4O新功能的视频中表示:“我们知道我们已经让您等待了,但我们认为这确实值得。我们认为您会喜欢它。”

在视频中,OpenAI展示了多个示例,包括解释相对论的漫画页面(支持英语和普通话输入)、基于个人照片的自定义交易卡、结合多个图像的纪念硬币设计,以及具有高度细节和长提示的复杂图像生成。

尽管生成速度较慢,但Altman强调,质量的显著提升值得等待。他表示:“图像生成速度比我们以前的模型慢得多,但结果令人难以置信地好。随着时间的推移,我们会让它更快。”

目前,该功能正在逐步推出,用户可以通过观察图像呈现方式来判断系统版本。与DALL·E 3不同,GPT-4O的图像会从上到下实时生成。

除了创造精美的图像外,这项技术还具备广泛的应用潜力。一位OpenAI研究科学家解释道:“这些模型现在可以‘看到’它们所知道的知识,并以视觉方式将其外部化。” 这为教育应用(如科学图表和信息海报)以及主题一致的图像编辑提供了可能性。

为了防止滥用,OpenAI实施了多项保护措施,包括防止生成深度伪造内容、非法内容和去除水印。虽然生成的图像没有可见水印,但它们包含C2PA元数据以标识为AI生成,同时公司正在开发跟踪图像来源的工具。

未来,OpenAI计划将这一功能引入其API,使开发者能够将技术集成到自己的应用程序中。使用条款明确规定,用户将保留其生成图像的所有权,但需遵守公司的使用政策。

编辑:塞巴斯蒂安·辛克莱(Sebastian Sinclair)乔什·奎特纳(Josh Quittner)

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥6,213.97亿
2 欧易OKX欧易OKX ¥2,318.31亿
3 HTXHTX ¥347.50亿
4 CoinbaseCoinbase ¥229.59亿
5 芝麻开门芝麻开门 ¥1,121.55亿
6 BitgetBitget ¥1,660.54亿
7 BybitBybit ¥1,927.31亿
8 Crypto.comCrypto.com ¥307.18亿
9 BitfinexBitfinex ¥17.67亿
10 抹茶抹茶 ¥2,246.04亿