币币情报道:
中国科技巨头腾讯近日推出了其最新的大型语言模型——Hunyuan Turbo S。该模型以更快的响应速度和卓越的推理能力为核心亮点,同时在复杂任务处理上表现优异。
据腾讯官方介绍,Hunyuan Turbo S相较于之前的版本,单词生成速度提升了一倍,延迟降低了44%。在微博上分享。
这款新模型采用了混合架构,成功集成了Mamba和Transformer技术,并首次应用于专家模型(MOE)的超大混合物中。这种技术融合旨在解决AI开发中的关键问题:Mamba擅长处理长序列数据,而Transformer则能捕捉复杂的上下文信息,从而降低训练和推理成本。
腾讯在其官方微信频道中表示:“快速思考与深度推理的结合和互补,可以让大型模型更加智能、高效地解决问题。”公司从人类认知过程中汲取灵感,设计了Hunyuan Turbo S,使其既能提供类似人类直觉的即时反应,又能保持对复杂问题的分析推理能力。
性能基准测试显示,Hunyuan Turbo S在多项任务中表现优异。例如,在MMLU测试中得分89.5,略高于OpenAI的GPT-4O;在数学推理基准Math和AIME2024中获得最高分;在中文SimpleQA任务中得分为70.8,超越了DeepSeek的68.0。然而,在某些领域如LiveCodebench中,其表现仍落后于GPT-4O和Claude 3.5。
图像来源:腾讯
这一发布进一步加剧了中国科技公司在AI领域的激烈竞争。DeepSeek等初创公司凭借低成本、高性能的模型脱颖而出,向腾讯、阿里巴巴以及美国的OpenAI等巨头施加压力。
据报道,DeepSeek模型的训练成本约为600万美元,运行费用低廉,每百万个标记的输出成本仅为150美元,远低于OpenAI GPT-4.5的价格(约1110美元)。
相比之下,Hunyuan Turbo S的定价更具竞争力:输入价格为每百万个标记0.11美元,输出价格为每百万个标记0.28美元,比此前的Turbo型号更便宜。目前,该模型可通过腾讯云API访问,公司还提供了一周的免费试用,但尚未公开下载。
尽管如此,Hunyuan Turbo S目前尚未全面开放,开发者和企业需通过等待清单申请访问权限。腾讯暂未透露是否会通过其他平台如GitHub发布模型。
由于其对速度的高度优化,Hunyuan Turbo S非常适合实时应用,如虚拟助手和客户服务机器人——这些领域在中国市场需求旺盛。如果该模型能够兑现其承诺,腾讯将在竞争中占据显著优势。
随着中国政府推动本地模型的普及,中国AI领域的竞争愈发激烈。除了腾讯,阿里巴巴最近发布了Qwen 2.5,而DeepSeek等初创公司也在持续推出更强大的模型。
编辑:安德鲁·海沃德(Andrew Hayward)