GPT-5 会成为夏季的惊喜之作吗?以下是一些值得期待的内容

16 小时前 18 技术
摘要
OpenAI 的全新旗舰模型 GPT-5 即将问世。业内人士表示,它可能会改变游戏规则,也可能只是又一次被过度炒作的升级 。
币币情报道:

值得关注的是——OpenAI 的 GPT-5 预计将于今年夏天发布。它会成为 AI 重磅炸弹吗?

Sam Altman 在 6 月份公司首次播客节目并随意提到,该车型将融合之前车型的功能,并“可能在今年夏天的某个时候”上市。

一些 OpenAI 观察者预测它将到达在接下来的几周内。分析OpenAI 模型发布历史指出,GPT-4 于 2023 年 3 月发布,GPT-4-Turbo(为 ChatGPT 提供支持)于 2023 年 11 月发布。更快的多模态模型 GPT-4o 于 2024 年 5 月推出。这意味着 OpenAI 一直在更快地完善和迭代模型。

但对于竞争如此激烈、发展如此迅速的人工智能市场来说,这还不够快。今年 2 月,在 X 上被问及 GPT-5 何时发布时,Altman“几周/几个月”。几周确实变成了几个月,与此同时,竞争对手正在迅速缩小差距,Meta 斥资数十亿美元在过去的 10 天里,OpenAI 花费了数百万美元来挖走一些顶尖科学家。

根据 Menlo Ventures 的数据,OpenAI 的企业市场份额暴跌从 50% 上升到 34%,而 Anthropic 则从 12% 翻了一番,达到 24%。谷歌的 Gemini 2.5 Pro 在数学推理领域彻底击败了竞争对手,DeepSeek R-1 成为“革命性”的代名词——击败了闭源替代品——甚至 xAI 的 Grok(之前仅以“趣味模式”配置而闻名)也开始受到程序员的重视。

 GPT-5 会成为夏季的惊喜之作吗?以下是一些值得期待的内容
图片:Menlo Ventures

对 GPT-5 的期望

根据 Altman 的说法,即将推出的 GPT 模型将有效地一个模型统治所有模型.

GPT-5 有望将 OpenAI 的各种模型和工具统一到一个系统中,从而无需“模型选择器”。用户无需再在不同的专用模型之间进行选择——一个系统即可处理文本、图像、音频以及潜在的视频。

到目前为止,这些任务分布在 GPT-4.1、Dall-E、GPT-4o、o3、Advanced Voice、Vision 和 Sora 上。将所有内容集中到一个真正的多模态模型中是一项相当大的成就。

技术规格看起来也雄心勃勃。该模型预计将显著扩展上下文窗口,可能超过 100 万个标记,一些报道推测其甚至可能达到 200 万个标记。就上下文而言,GPT-4o 的最大标记数为 12.8 万个。这相当于处理一章内容和消化整本书的区别。

OpenAI 于 2024 年开始在 GPT-4-Turbo 中推出实验性记忆功能,使助手能够记住用户姓名、语气偏好和正在进行的项目等详细信息。用户可以查看、更新或删除这些记忆,这些记忆是随着时间的推移逐渐建立起来的,而不是基于单次交互。

在 GPT-5 中,记忆预计将更加深度集成和无缝衔接——毕竟,该模型将能够处理近 100 倍的关于你的信息,可能拥有 200 万个标记,而不是 8 万个。这将使该模型能够在几周后回忆起对话,随着时间的推移构建上下文知识,并提供更类似于个性化数字助理的连续性。

推理能力的提升听起来同样雄心勃勃。预计这一进步将体现为向“结构化思维链”处理的转变,使模型能够将复杂问题分解为逻辑清晰、多步骤的序列,从而模拟人类的深思熟虑的思维过程。

至于参数,普遍的传言是 10 到 50 万亿,甚至是一个引人注目的千万亿然而,正如奥特曼自己所说,“参数缩放的时代已经结束”,因为人工智能训练技术的重点从数量转向质量,更好的学习方法使得较小的模型变得极其强大。

这是 OpenAI 面临的另一个根本问题:网络数据耗尽进行训练。解决方案是什么?让人工智能生成自己的训练数据,这可能标志着人工智能训练的新时代.

Image: Sequoia Capital via YouTube
图片:红杉资本通过 YouTube 提供

专家们的意见

AI 代理链上竞技场首席执行官 Andrew Hill 表示:“下一个飞跃将是在可验证域中生成合成数据。”记起,告诉解密“我们在互联网规模数据方面遇到了瓶颈,但推理方面的突破表明,只要有验证机制,模型就可以生成高质量的训练数据。最简单的例子是数学问题,你可以检查答案是否正确,以及代码,你可以运行单元测试。”

希尔认为这是一次变革:“这一飞跃在于创造出比人类生成的数据更好的新数据,因为它通过验证循环反复完善,而且创建速度要快得多。”

基准测试是另一个战场:人工智能专家兼教育家戴维·夏皮罗期望该模型在MMLU上达到了95%的准确率,在SWEBench上也从32%飙升至82%——这几乎是一个神级的AI模型。哪怕只有一半的准确率是真的,GPT-5都会成为头条新闻。OpenAI内部也对这个模型充满信心,甚至一些OpenAI的研究人员在模型发布前就对其进行了大力宣传。

不要相信炒作

专家解密接受采访的一位人士提醒道,任何期待 GPT-5 达到通用人工智能 (AGI) 水平的人都应该抑制自己的热情。希尔表示,他预计这将是一个“循序渐进的进步,伪装成革命”。

Wyatt Mayham,首席执行官西北人工智能咨询公司更进一步,预测 GPT-5 可能会是“一次有意义的飞跃,而非渐进式的飞跃”,并补充道:“我期待更长的上下文窗口、更原生的多模态性,以及智能体行动和推理方式的转变。我绝不指望它能带来灵丹妙药,但我确实认为 GPT-5 应该能够扩展我们可以自信地交付给用户的工具类型。”

迈哈姆表示,每前进两步就会后退一步:“每次重大发布都会解决上一代产品最明显的局限性,同时引入新的局限性。”

GPT-4 弥补了 GPT-3 的推理缺陷,但遇到了数据瓶颈。推理模型 (o3) 修复了逻辑思维,但成本高昂且速度缓慢。

Tony Tong,首席技术官智力人工智能——一个为投资者提供人工智能洞察的平台——也持谨慎态度,期待一个更好的模型,但不像许多人工智能狂热分子那样期待改变世界的东西。“我押注 GPT-5 将结合更深层次的多模态推理、更好的工具或记忆基础,以及在协调和代理行为控制方面取得的重大进展,”Tong 告诉解密.“想想:更可控、更可靠、更具适应性。”

首席执行官帕特里斯·威廉姆斯-林多 (Patrice Williams-Lindo)职业游牧者预测 GPT-5 只不过是一场“渐进式革命”。然而,她怀疑,它可能更适合日常 AI 用户,而非企业应用。

威廉姆斯-林多表示:“可靠性、情境记忆、多模态性和较低错误率的复合效应,可能会彻底改变人们对这些系统的信任程度和日常使用方式。这本身就可能是一个巨大的胜利。”

一些专家只是怀疑 GPT-5 或任何其他 LLM 是否会被人们记住。

人工智能研究员 Gary Marcus 一直对纯粹的缩放方法持批评态度(更好的模型需要更多的参数),他以惯常的方式写道预测全年:“2025 年可能不会出现‘GPT-5 级别’的模型(这意味着根据社区共识判断,这将是一次巨大的、全面的量子飞跃)。”

马库斯押注的是升级公告,而不是全新的基础型号。话虽如此,这仍然是他不太有把握的猜测之一。

数十亿美元的人才流失

不过,马克·扎克伯格对 OpenAI 智囊团的突袭是否会推迟 GPT-5 的发布,目前还不得而知。

“这肯定会减缓他们的努力,”去中心化人工智能网络的首席代码维护者 David A. Johnston莫菲斯,告诉解密。约翰斯顿认为,除了金钱之外,顶尖人才在道德上也更愿意致力于 Llama 这样的开源项目,而不是 ChatGPT 或 Claude 这样的闭源替代方案。

不过,一些专家认为,该项目已经发展成熟,人才流失不会对其造成影响。

Mayham 表示,“2025 年 7 月发布看起来是现实的。即使一些关键人才转投 Meta,我认为 OpenAI 仍然走在正确的轨道上。他们保留了核心领导层,并调整了薪酬,所以看起来他们正在稳步发展。”

Williams-Lindo 补充道:“OpenAI 的发展势头和资本储备都很强劲。更重要的不是哪些人离开了,而是留下的人如何重新调整优先事项——尤其是他们是加倍投入产品化,还是暂停以应对安全或法律压力。”

如果以史为鉴,世界很快就会迎来 GPT-5 的发布,随之而来的是一系列的头条新闻、热门话题以及“就这些了吗?”的尴尬时刻。然后,整个行业将开始提出下一个重要的问题:GPT-6 何时发布?

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥5,317.33亿
2 欧易OKX欧易OKX ¥2,128.59亿
3 HTXHTX ¥398.31亿
4 CoinbaseCoinbase ¥105.73亿
5 芝麻开门芝麻开门 ¥1,486.53亿
6 BitgetBitget ¥1,664.07亿
7 BybitBybit ¥1,691.99亿
8 UpbitUpbit ¥76.23亿
9 Crypto.comCrypto.com ¥260.04亿
10 BitfinexBitfinex ¥8.11亿