研究人员以不到50美元创建可与OpenAI o1模型相媲美的s1模型

来源: 星球日报274天前

根据上周五发布的一篇新研究论文，斯坦福大学和华盛顿大学的人工智能研究人员能够以不到 50 美元的云计算积分训练一个人工智能“推理”模型。在衡量数学和编码能力的测试中，被称为 s1 的模型表现类似于尖端推理模型，例如 OpenAI 的 o1 和 DeepSeek 的 r1。s1 模型以及用于训练它的数据和代码可在 GitHub 上找到。 s1 背后的团队表示，他们通过提炼（distillation）创建了人工智能模型，这是一种通过训练另一个人工智能模型的答案来提取“推理”能力的过程。研究人员表示，s1 是从谷歌的推理模型之一 Gemini 2.0 Flash Thinking Experimental 中提炼出来的。提炼是伯克利研究人员上个月以约 450 美元的价格创建人工智能推理模型所采用的相同方法。 s1 背后的研究人员正在寻找实现强大推理性能和“测试时间扩展”的最简单方法，或者让 AI 模型在回答问题之前进行更多思考。这些是 OpenAI 的 o1 中的一些突破，其他 AI 实验室试图通过各种技术复制这些突破。s1 论文提出，可以使用一种称为监督微调（SFT）的过程，利用相对较小的数据集提炼推理模型，在此过程中，明确指示 AI 模型模仿数据集中的某些行为。SFT 往往比 DeepSeek 用于训练其对 OpenAI 的 o1、R1 的答案的大规模强化学习方法更便宜。 s1 基于阿里巴巴旗下中国 AI 实验室 Qwen 的一个小型现成 AI 模型，可免费下载。为了训练 s1，研究人员创建了一个仅包含 1,000 个精心策划的问题的数据集，并附上这些问题的答案以及 Google 的 Gemini 2.0 Flash Thinking Experimental 中每个答案背后的“思考”过程。据研究人员称，在使用 16 个 Nvidia H100 GPU 不到 30 分钟的时间内训练 s1 后，s1 在某些 AI 基准测试中取得了强劲的表现。参与该项目的斯坦福大学研究员 Niklas Muennighoff 称，他现在就可以以大约 20 美元的价格租用必要的计算机。（TechCrunch）

利好

利空

原文链接

热门新闻

交易平台最新公告查看更多>

成交额排行榜

交易所
币种

排名	交易所	成交额
1	币安网	¥9,141.45亿
2	欧易OKX	¥3,033.10亿
3	HTX	¥516.48亿
4	Coinbase	¥276.79亿
5	大门	¥2,031.90亿
6	Bitget	¥1,011.13亿
7	Bybit	¥2,518.46亿
8	K网(Kraken)	¥168.50亿
9	双子星（Gemini）	¥15.97亿
10	Upbit	¥125.22亿

排名	币种	成交额
1	泰达币	¥4,455.58亿
2	比特币	¥1,789.73亿
3	以太坊	¥1,346.52亿
4	USD Coin	¥575.73亿
5	Solana	¥430.81亿
6	大零币	¥331.93亿
7	瑞波币	¥327.74亿
8	Filecoin	¥309.73亿
9	First Digital USD	¥246.69亿
10	币安币	¥224.09亿