深度求索发布开源代码大模型 DeepSeek Coder
来源: 巴比特544天前
巴比特讯,11 月 2 日,幻方量化宣布“深度求索(DeepSeek)”在成立半年后发布第一代大模型 DeepSeek Coder,1B,7B,33B 全系列模型开源且免费商用。公告显示,DeepSeek Coder 模型有指令 Python 快速写出程序、修改 UI(用户界面)、测试 bug(程序错误)以及数据分析,学写 SQL(数据库语言)等技能。 据介绍,与之前最好的开源大模型 CodeLlama 相比,DeepSeek Coder 在代码生成任务上(使用标准数据集 HumanEval、MBPP 和 DS-1000 进行评测)分别领先 9.3%、10.8% 和 5.9%。其中 DeepSeek Coder 的 70 亿参数版本在代码能力上达到了 CodeLlama 的 340 亿参数水平。经过指令调优后的 DeepSeek Coder 模型更是全面超越了 GPT3.5-Turbo。
热门新闻
交易平台最新公告查看更多>