OpenAI推出全新可对话ChatGPT语音机器人
来源:量子号
OpenAI 近日正式发布了一款全新的先进人工智能聊天机器人,该机器人支持语音交互功能。尽管目前仅向部分用户开放,但其标志着 OpenAI 在新一代人工智能语音助手领域迈出了重要一步。
这款新的 ChatGPT 语音机器人被设计为类似于 Siri 和 Alexa 的语音助手,但具备更强的功能和更自然的对话体验。它可以识别不同语调传达的信息、对中断做出即时反应,并实时回答用户的提问。此外,该机器人经过训练以生成更自然的声音,能够通过语音表达多种情绪。
新语音模式由 OpenAI 最新的 GPT-4o 模型驱动,该模型融合了语音、文本和视觉能力。为了收集用户反馈,OpenAI 首先向“一小部分”ChatGPT Plus 的付费用户推出了这一功能。公司表示,将在今年秋季向所有 ChatGPT Plus 订阅用户开放。ChatGPT Plus 的订阅费用为每月 20 美元(约合 144 元人民币)。OpenAI 将通过 ChatGPT 应用程序通知首批用户,并提供使用新模型的详细说明。
这项语音功能最初于 5 月份宣布,但由于需要更多时间完善安全功能(例如模型检测和拒绝不良内容的能力),因此比原计划晚了一个月推出。OpenAI 还表示,他们正在优化基础设施,以便为数百万用户提供流畅的实时响应。
在正式推出之前,OpenAI 已与 100 多名外部红队成员合作测试该模型的语音功能。这些测试人员来自 29 个国家,共掌握 45 种语言,任务是探测模型可能存在的缺陷。
OpenAI 强调已实施多项安全机制以保护用户权益。例如,为防止该模型被用于制作音频深度伪造,公司与配音演员合作创建了四种预设声音,且明确表示 GPT-4o 不会模仿或生成他人的声音。
然而,在首次推出 GPT-4o 时,OpenAI 因使用名为“Sky”的语音而引发争议,该声音被认为与女演员斯嘉丽·约翰逊的声音极为相似。约翰逊发表声明称,OpenAI 曾联系她希望获得授权将她的声音用于模型中,但她拒绝了。她表示,在听到模型演示中的声音后感到震惊。对此,OpenAI 否认该声音与约翰逊相关,但仍暂停使用 Sky。
此外,OpenAI 还面临多起涉嫌侵犯版权的诉讼。公司表示,已采用过滤器来识别并阻止生成音乐或其他受版权保护的音频请求。同时,OpenAI 将其在基于文本的模型中使用的安全机制应用于 GPT-4o,以防止其生成违法或有害内容。
展望未来,OpenAI 计划为该助手加入更多高级功能,例如视频和屏幕共享,这将进一步提升其实用性。在 5 月份的一次演示中,员工通过手机摄像头拍摄一张纸上的数学方程式,并要求人工智能帮助解决;他们还共享电脑屏幕,请求模型协助解决编程问题。不过,这些功能目前尚未推出,预计将在未来的某个未指定日期上线。
- 1 2025年比特币策略:5步实现你的第一个100万美元
- 2稳定币脱锚事件对加密市场的影响:从价格突变到系统性风险
- 3以太坊(ETH)价格分析:7月25日市场展望与关键阻力位解析
- 4“卖出以太坊,买入比特币”——彼得·希夫的建议是否值得跟随?
- 5稳定币合法化如何推动以太坊进入全新金融时代?
- 6比特币实际市值突破1万亿美元,但需警惕这些风险信号!
- 7空投周报 | Linea代币经济学预计7月底揭晓;MetaMask新增空投申领工具(7.14-7.20)
- 8万事达卡称《GENIUS法案》为稳定币发展带来重要转折点
- 9Peter Thiel豪掷重金押注以太坊:BitMine股价飙升背后的加密帝国布局
- 交易所
- 币种
排名 | 交易所 | 成交额 |
---|---|---|
1 | ![]() |
¥4,622.44亿 |
2 | ![]() |
¥1,681.57亿 |
3 | ![]() |
¥312.11亿 |
4 | ![]() |
¥111.05亿 |
5 | ![]() |
¥1,294.82亿 |
6 | ![]() |
¥1,423.74亿 |
7 | ![]() |
¥1,396.05亿 |
8 | ![]() |
¥10.89亿 |
9 | ![]() |
¥115.56亿 |
10 | ![]() |
¥155.54亿 |