腾讯推出Hunyuan T1推理模型,加速AI竞赛
腾讯控股推出了一款全新的人工智能(AI)推理模型Hunyuan T1,旨在以高性能和高性价比与DeepSeek R1展开竞争。
本周五,腾讯正式发布T1模型,该模型利用大规模增强学习技术,与DeepSeek R1采用的相同技术框架相呼应。这一技术最初在R1模型中于今年一月投入使用。
T1在基准测试中表现出色
此次T1模型的官方版本是在腾讯元宝聊天机器人的Beta测试基础上进一步优化而成。该模型在多任务语言理解(MMLU)Pro基准测试中取得了87.2分的成绩,超越了DeepSeek-R1的84分,但略逊于OpenAI O1的89.3分。
此外,T1在其他评估中也表现出优异的结果。例如,在2024年美国邀请赛数学考试(AIME)中,T1得分为78.2分,与R1的79.8分和O1的79.2分接近。腾讯表示,该模型在中文场景表现尤为突出,在C-Eval Suite中得分高达91.8分,与R1持平,并优于O1的87.8分。
在定价策略上,T1与DeepSeek保持一致,这是其吸引用户的显著优势之一。T1的输入成本为每百万个令牌1元(约合0.14美元),输出成本为每四百万个令牌1元。
T1的输入价格与R1白天的收费一致,均为每百万个令牌1元;而在夜间,R1的价格低至0.25元。相比之下,R1白天的输出价格为每百万个令牌16元,夜间降至4元。
据腾讯介绍,这是行业内首个采用混合架构的模型,结合了Google Transformer以及由卡内基梅隆大学和普林斯顿大学开发的Mamba系统。与完全基于Transformer的传统架构相比,这种设计大幅降低了训练与推理成本,同时优化了内存使用。
公司宣称,T1“在显著减少资源消耗的同时,确保了对长文本信息的捕捉能力”,使解码速度提升了200%。
一位前京东大数据专家在其技术博客NCJRYDS中对T1和R1进行了对比测试,并邀请其他大型语言模型(如Claude和ChatGPT)对结果进行评判。结果显示,腾讯模型在生成古代中国诗歌时略显逊色,但在不同语境下解释中文词汇时击败了DeepSeek。
另一家博客Goplayai为腾讯模型设置了四个数学问题。经过五分钟的计算后,T1在最难的问题上给出了错误答案。
腾讯通过双核战略扩展AI布局
作为中国最大的社交媒体平台微信和全球最大的视频游戏业务运营商,腾讯将人工智能视为其新的核心收入来源。目前,公司已将DeepSeek-R1集成到其云平台及元宝聊天机器人中,同时提供自家Hunyuan系列作为另一种选择。
腾讯董事长兼首席执行官马化腾(Pony Ma)近期表示,他对DeepSeek打造“独立、真正开源且免费的产品”深表赞赏。
马化腾指出,腾讯正在实施“双核”AI战略,即同时使用DeepSeek和自家Yuanbao模型。这种策略类似于公司在视频游戏行业中通过自主研发与独立工作室合作并行发展的模式。
密码大都会学院:厌倦了市场波动?了解DEFI如何帮助您建立稳定的被动收入。立即注册