谷歌推出Gemini Deep Research功能:AI生成播客助力深度学习

2025-03-22 83 其它文章
摘要
Google透露,用户可以使用音频概述将文档,幻灯片甚至深入的研究报告转换为易于出现的播客。该公司表示,它将允许用户选择一个新的“生成音频概述”选项,以根据他们的研究收听音频概述 。
币币情报道:

谷歌近日宣布了一项新功能,允许用户将文档、幻灯片甚至深入研究报告转换为易于收听的播客。通过选择“生成音频概述”选项,用户可以基于其研究内容生成音频形式的总结。

此外,谷歌还通过Gemini 2.0 Flash思维实验模式进一步优化了Gemini的研究能力。科技巨头表示,这一升级将帮助Gemini生成更高质量、更详细和更具洞察力的多页报告。

谷歌让用户从Gemini Deep Research中制作AI播客

谷歌宣布其Gemini应用程序将支持基于深度研究生成音频概述。公司表示,用户可以将Gemini生成的深度报告转化为由两个AI“主持人”对话形式呈现的播客。

“将其视为帮助您从零到深入了解一个主题。”

- Gemini高级产品经理Aarush Selvan。

去年9月,谷歌推出了NotebookLM音频概述功能,将文档转化为引人入胜的音频讨论。该公司强调,两位虚拟主持人可以根据用户的资料展开生动活泼的“深度潜水”讨论,“在主题之间建立联系并进行互动。”

此次升级旨在增强NotebookLM现有功能,该功能帮助用户与笔记、成绩单及其他文档交互。谷歌承认,这只是NotebookLM音频版本的一次迭代,因为该应用已使用Gemini AI模型对研究内容进行汇总。

谷歌现在引入了相同的深度研究功能,当用户点击右上角的不同选项(包括生成音频概述)时即可访问该功能。公司补充道,即使在旅途中,用户也能通过多任务处理在聆听时完成其他工作,并认为“如果您以这种方式更好地吸收信息,那就太棒了。”

Google AI Studio的主要产品经理Logan Kilpatrick提到,这项深度研究功能让他印象深刻,因为他能够根据查询浏览145个不同的网站。

本周早些时候,谷歌还向Gemini应用程序的免费用户和高级订阅者推出了Audio概述功能。科技公司表示,该功能对于Deep Research(其“代理”AI功能)更加实用。用户可以让Gemini探索特定主题,并根据发现生成详细报告。完成后,用户可以选择“生成音频概述”选项,基于研究内容收听音频概述。

谷歌也提到,音频概述目前有一些限制,例如需要几分钟生成播客式讨论,并且仅支持英语。未来将增加更多语言支持。公司强调,音频概述可在网络和Gemini移动应用中访问,用户可轻松分享或下载以便随时随地收听。

谷歌推出Gemini 2.0 Flash思维实验模式

谷歌还推出了Gemini的一项新功能“Canvas”,该功能完善了用户的文档、代码和音频概述,并将其转化为播客风格的讨论。谷歌首席执行官Sundar Pichai表示,用户可以利用Canvas创建文档或编码项目,“它能快速生成原型,您可以实时使用Gemini进行编辑。”

与此同时,谷歌于3月17日推出了Gemini 2.0 Flash思维实验模式,该模式可分析用户的搜索历史记录以更好地了解其兴趣并提供更有用的答案。公司表示,该模型经过培训,能够分解提示以加强推理能力并提供更好的响应。

谷歌还强调,Gemini高级用户将获得2.0 Flash思维实验模式访问权限,支持1M令牌上下文窗口。科技公司表示,这将通过尝试和分析大量信息解决比以往更复杂的问题。

密码大都会学院:厌倦了市场波动?了解DEFI如何帮助您建立稳定的被动收入。立即注册

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥4,722.48亿
2 欧易OKX欧易OKX ¥1,715.35亿
3 HTXHTX ¥263.13亿
4 CoinbaseCoinbase ¥146.75亿
5 芝麻开门芝麻开门 ¥841.64亿
6 BitgetBitget ¥1,134.23亿
7 BybitBybit ¥1,382.72亿
8 Crypto.comCrypto.com ¥199.81亿
9 BitfinexBitfinex ¥10.27亿
10 抹茶抹茶 ¥1,917.97亿