谷歌推出Gemini Deep Research功能:AI生成播客助力深度学习
谷歌近日宣布了一项新功能,允许用户将文档、幻灯片甚至深入研究报告转换为易于收听的播客。通过选择“生成音频概述”选项,用户可以基于其研究内容生成音频形式的总结。
此外,谷歌还通过Gemini 2.0 Flash思维实验模式进一步优化了Gemini的研究能力。科技巨头表示,这一升级将帮助Gemini生成更高质量、更详细和更具洞察力的多页报告。
谷歌让用户从Gemini Deep Research中制作AI播客
深入研究和AI概述是一个疯狂的组合。
您可以通过生成完整的报告并将其变成播客来学习任何内容。
Gemini参考所有来源,并依赖数百个网站。
改变游戏规则的学习方式。pic.twitter.com/xkpHM9DVKC
- 保罗(Paul)2025年3月21日
谷歌宣布其Gemini应用程序将支持基于深度研究生成音频概述。公司表示,用户可以将Gemini生成的深度报告转化为由两个AI“主持人”对话形式呈现的播客。
“将其视为帮助您从零到深入了解一个主题。”
- Gemini高级产品经理Aarush Selvan。
去年9月,谷歌推出了NotebookLM音频概述功能,将文档转化为引人入胜的音频讨论。该公司强调,两位虚拟主持人可以根据用户的资料展开生动活泼的“深度潜水”讨论,“在主题之间建立联系并进行互动。”
此次升级旨在增强NotebookLM现有功能,该功能帮助用户与笔记、成绩单及其他文档交互。谷歌承认,这只是NotebookLM音频版本的一次迭代,因为该应用已使用Gemini AI模型对研究内容进行汇总。
谷歌现在引入了相同的深度研究功能,当用户点击右上角的不同选项(包括生成音频概述)时即可访问该功能。公司补充道,即使在旅途中,用户也能通过多任务处理在聆听时完成其他工作,并认为“如果您以这种方式更好地吸收信息,那就太棒了。”
Google AI Studio的主要产品经理Logan Kilpatrick提到,这项深度研究功能让他印象深刻,因为他能够根据查询浏览145个不同的网站。
本周早些时候,谷歌还向Gemini应用程序的免费用户和高级订阅者推出了Audio概述功能。科技公司表示,该功能对于Deep Research(其“代理”AI功能)更加实用。用户可以让Gemini探索特定主题,并根据发现生成详细报告。完成后,用户可以选择“生成音频概述”选项,基于研究内容收听音频概述。
谷歌也提到,音频概述目前有一些限制,例如需要几分钟生成播客式讨论,并且仅支持英语。未来将增加更多语言支持。公司强调,音频概述可在网络和Gemini移动应用中访问,用户可轻松分享或下载以便随时随地收听。
谷歌推出Gemini 2.0 Flash思维实验模式
谷歌还推出了Gemini的一项新功能“Canvas”,该功能完善了用户的文档、代码和音频概述,并将其转化为播客风格的讨论。谷歌首席执行官Sundar Pichai表示,用户可以利用Canvas创建文档或编码项目,“它能快速生成原型,您可以实时使用Gemini进行编辑。”
与此同时,谷歌于3月17日推出了Gemini 2.0 Flash思维实验模式,该模式可分析用户的搜索历史记录以更好地了解其兴趣并提供更有用的答案。公司表示,该模型经过培训,能够分解提示以加强推理能力并提供更好的响应。
谷歌还强调,Gemini高级用户将获得2.0 Flash思维实验模式访问权限,支持1M令牌上下文窗口。科技公司表示,这将通过尝试和分析大量信息解决比以往更复杂的问题。
密码大都会学院:厌倦了市场波动?了解DEFI如何帮助您建立稳定的被动收入。立即注册
- 1加密市场乱象:CLS Global操纵案与做市商掠夺性行为的监管启示
- 2川怼怼 到底能不能开除鲍老板?
- 34 Alpha宏观周报:软硬撕裂、关税反复:衰退前夜?市场困局何在?
- 4Web3 “过气”的超级明星协议 如今都怎么样了?
- 5特朗普猛烈抨击鲍威尔引发市场震荡:美元下挫,比特币突破8.7万美元
- 624H热门币种与要闻 | 币安Alpha上线评估TGE及空投参与资格的积分系统;币安拟为加密资产管理者提供与传统金融交易类似的“基金账户”(4月25日)
- 7黄金疯涨后,白银会是下一个投资焦点吗?
- 8空投周报 | 币安即将空投EPT代币,Walrus计划向SUI生态游戏掌机持有者发放空投(4.14-4.20)
- 9AI Agent周报 | auto.fun平台上线,原生代币为ai16z;Virtuals推出新Launchpad平台Genesis(4.14-4.20)