OpenAI发布更新:ChatGPT语音助手更自然、更具吸引力
OpenAI于3月24日宣布推出一系列更新,旨在提升ChatGPT AI语音助手的对话质量,使其更加自然流畅,并显著减少中断频率。此次更新使ChatGPT在与竞争对手如Sesame和Alexa的竞争中占据更有利的地位。
OpenAI发布了一项高级语音模式的更新,通过实时对话功能提升了AI助手的表现力,同时减少了对用户说话过程中的干扰。此次改进的重点在于提供一个更吸引人的AI助手形象以及更少的对话中断。
OpenAI研究员Manuka Stratta在官方社交媒体渠道发布的演示视频中展示了这些变化。视频中,Manuka展示了新模型如何为用户提供更多思考和回应的时间,而无需担心被打断。
OpenAI优化了AI语音助手以实现更自然的对话
OpenAI发布了一项公告,引入了升级版的ChatGPT语音模式,该模式减少了不必要的中断,并支持自然停顿。付费用户还体验到了更优质的模型个性,被描述为“引人入胜、直接且简洁”。
-Tibor Blaho(@btibor91)2025年3月24日
ChatGPT推出了一种新的高级语音模式,所有免费用户和付费订阅者均可使用,包括Plus、Team、EDU、Business和Pro计划的用户。这一更新功能支持实时对话,增强了AI助手的灵活性,并最大限度地减少了对话中的中断。
在AI语音助手市场竞争日益激烈的背景下,这一更新显得尤为重要。OpenAI面临来自新兴竞争者(如Andreessen Horowitz支持的初创公司Sesame及其自然声音助手Maya和Miles)以及亚马逊为其Alexa产品引入的大语言模型升级的压力。
“由于减少了打断,您将有更多时间整理思绪,而不必觉得必须填补所有的空白和沉默。”
- Manuka Stratta
OpenAI发言人表示,新版AI语音助手将为用户提供“更直接、引人入胜、简洁、具体且富有创意的答案”。
此外,OpenAI还宣布推出了新的自动语音识别模型(ASR)和文本到语音(TTS)技术,标志着AI驱动语音技术的又一进步。新型号不仅具备更高的准确性,还具有更强的经济性,为企业部署AI驱动语音代理提供了替代方案。
新的ASR模型(GPT-4O-Transcribe和GPT-4O-Mini-Transcribe)相较于OpenAI此前最先进的转录模型Whisper实现了显著飞跃。这些模型在单词错误率上表现更佳,并能更好地处理多种语言、口音及背景噪声。新的TTS模型则可以生成高度拟真的声音,带有自然语调和情感表现力,还能通过自然语言提示调整语音风格、情绪和语气。
ChatGPT语音助手或致用户孤独感增加
OpenAI与MIT媒体实验室合作开展的一项新研究揭示,大多数ChatGPT用户将其用于实际目的。该研究分析了近4000万次聊天互动,将用户分为不同群体:一些仅使用文本交互,另一些则尝试与AI角色进行语音互动——其中一种设计更具情感化,另一种保持中立。
数据显示,重度依赖高级语音模式的用户与ChatGPT建立了更深层次的情感联系,有些人甚至将其视为“朋友”。语音功能的效果因人而异,短暂互动能够改善情绪,但长期频繁使用有时会产生相反效果。
研究结果表明,个性化对话与较高的孤独感相关联,但情绪依赖性较低;相比之下,非人格化对话表现出不同的模式,情绪依赖水平随着大量使用而上升。
参与该项目的OpenAI安全研究员Jason Phang表示,OpenAI目前所做的许多工作仍处于初步阶段,但公司正试图开启关于这些影响及其对用户长期影响的讨论。伦敦国王学院AI与社会教授Kate Devlin指出,虽然人们可能并非刻意在情感上依赖ChatGPT,但他们无法完全将人类情感与技术互动割裂开来。
加密大都会学院:即将推出 - 一种新的方式,在2025年通过DeFi赚取被动收入。了解更多
- 1加密市场乱象:CLS Global操纵案与做市商掠夺性行为的监管启示
- 2川怼怼 到底能不能开除鲍老板?
- 34 Alpha宏观周报:软硬撕裂、关税反复:衰退前夜?市场困局何在?
- 4Web3 “过气”的超级明星协议 如今都怎么样了?
- 5特朗普猛烈抨击鲍威尔引发市场震荡:美元下挫,比特币突破8.7万美元
- 624H热门币种与要闻 | 币安Alpha上线评估TGE及空投参与资格的积分系统;币安拟为加密资产管理者提供与传统金融交易类似的“基金账户”(4月25日)
- 7黄金疯涨后,白银会是下一个投资焦点吗?
- 8空投周报 | 币安即将空投EPT代币,Walrus计划向SUI生态游戏掌机持有者发放空投(4.14-4.20)
- 9AI Agent周报 | auto.fun平台上线,原生代币为ai16z;Virtuals推出新Launchpad平台Genesis(4.14-4.20)