OpenAI发布最新人工智能模型GPT-4o:免费开放给所有用户
来源:鞭牛士
5月14日消息,ChatGPT即将变得更加智能和实用。
OpenAI于周一宣布推出其最新的人工智能语言模型GPT-4o,这是一次对去年发布的GPT-4的重大更新。据悉,该模型将向所有用户免费开放,这意味着任何人都可以通过ChatGPT访问OpenAI最先进的技术。
根据OpenAI的演示,GPT-4o能够将ChatGPT转变为一个具备实时语音对话能力的数字个人助理。此外,它还可以通过文本和视觉交互,查看用户上传的截图、照片、文档或图表,并进行相关讨论。
OpenAI首席技术官Mira Murati表示,ChatGPT的新版本还将具备记忆功能,可以从之前的对话中学习,并支持实时翻译。
“这是我们首次在易用性方面迈出如此重要的一步。”Murati在公司旧金山总部的现场演示中说道,“这种互动变得更加自然和流畅。”
此次更新正值OpenAI在日益激烈的人工智能竞争中努力保持领先地位之际。包括谷歌和Meta在内的竞争对手正在开发越来越强大的大语言模型,为聊天机器人提供动力,并将其应用于各种其他产品。
OpenAI的活动恰逢谷歌年度I/O开发者大会前一天举行,预计谷歌将在会上发布其Gemini AI模型的更新。
与新的GPT-4o类似,谷歌的Gemini也是多模态的,可以解释和生成文本、图像和音频。
与此同时,OpenAI的更新也发生在苹果全球开发者大会之前,预计苹果将在下个月发布与人工智能相关的新功能,可能包括将AI技术融入下一代iPhone或iOS版本。
最新的GPT版本对微软来说也是一个利好消息,微软已向OpenAI投资数十亿美元,将其AI技术整合到自己的产品中。
OpenAI高管展示了与ChatGPT进行语音对话的场景,以获得解决数学问题的实时指导、讲述睡前故事以及获取编码建议。
ChatGPT能够以自然的人类声音或机器声音回应,甚至可以唱出部分回应。该工具还能够查看并讨论图表图像。
他们还展示了一个能检测用户情绪的模型;有一次,它听到了一位高管的呼吸声并鼓励他冷静下来。
“你不是吸尘器!”ChatGPT的声音(听起来与2013年电影《她》中斯嘉丽·约翰逊配音的数字伴侣非常相似)开玩笑地告诉工作人员。
ChatGPT还能通过自动翻译和响应以多种语言进行对话。据OpenAI称,该工具目前支持50多种语言。
“新的语音(和视频)模式是我用过的最好的计算机界面。”OpenAI首席执行官Sam Altman在博客文章中写道,“感觉就像电影中的人工智能;我仍然有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”
Murati表示,OpenAI将推出具有GPT-4o功能的ChatGPT桌面应用程序,为用户提供另一个与其技术交互的平台。
GPT-4o也将可供希望从OpenAI的GPT商店构建自定义聊天机器人的开发者使用,这一功能现在也可供非付费用户使用。
更新的技术和功能将在未来几个月内逐步引入ChatGPT。免费用户将与新的GPT-4o模型进行有限次数的交互,之后系统会自动恢复依赖旧的GPT-3.5模型;付费用户则可以使用最新型号访问更多数量的消息。
OpenAI首席技术官Mira Murati在今天的春季更新直播中表示,OpenAI正向ChatGPT的免费用户提供许多以前仅限订阅的功能,其中最大的亮点是浏览其GPT商店并使用自定义机器人的能力。
该公司还在其网站的博客中发布了此次更新。
就在四个月前,即1月10日,该公司向付费订阅者开放了GPT商店。该商店允许ChatGPT Plus订阅者创建自己的聊天机器人(称为GPT)并共享它们。目前一些受欢迎的机器人包括图像生成机器人、旨在帮助科学研究的名为Consensus的聊天机器人以及徽标制作机器人。
OpenAI表示将为GPT构建者提供基于参与的收入共享计划,该计划已于3月份开始测试。但由于该功能此前仅限于付费ChatGPT用户,因此这些机器人的受众范围受到限制。
OpenAI还让免费用户能够上传文件和照片以进行摘要和分析,使用ChatGPT搜索网络,并使用GPT-4存储以前的聊天记录,所有这些功能在此之前都是订阅锁定的。
OpenAI表示,已有超过1亿人在使用ChatGPT。
但升级后的ChatGPT体验——以及通过改进的语音对话与桌面端进行交互的能力——可能会吸引更多人使用其技术。
这些举措出台之际,谷歌和Meta正将人工智能集成到Instagram和Google Assistant等更广泛使用的消费产品中,可能会让这些公司的技术更普及、更易于使用。