OpenAI开源BrowseComp,重塑Agent浏览器评测

来源: 金色财经75天前
,今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主搜索、信息整合、准确性校准方面非常优秀。(AIGC开放社区)
利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥7,504.84亿
2 欧易OKX欧易OKX ¥2,992.09亿
3 HTXHTX ¥566.85亿
4 CoinbaseCoinbase ¥155.29亿
5 芝麻开门芝麻开门 ¥2,059.47亿
6 BitgetBitget ¥2,190.06亿
7 BybitBybit ¥2,502.82亿
8 Crypto.comCrypto.com ¥435.38亿
9 BitfinexBitfinex ¥19.50亿
10 抹茶抹茶 ¥2,124.59亿