李飞飞团队50美元复刻DeepSeek真相 基于阿里通义千问模型
2025-03-14 11:02:06 小编:铺路手游网
《科创板日报》2月6日讯,今日一则关于人工智能领域的新闻引发广泛关注。
据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?
《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。
根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。
青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。
“以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。 ” 谢伟迪说。
- 猜你喜欢
-
奈的教育日记汉化版75.98M游戏下载
-
心动小镇正版官方954.96M游戏下载
-
幸福宅女养成方法游戏完整版54.06M游戏下载
-
飞机大厨2024国际服83.91M游戏下载
-
漫画人app9.9MB游戏下载
-
路人娘捕捉学院安卓版38.23M游戏下载
-
航海争霸手游18.37M游戏下载
-
拷贝漫画app官方版下载9.9MB游戏下载
-
18+哔咔下载免费9.9MB游戏下载
- 相关手机游戏
-
鏋侀€熻禌杞﹀悜鍓嶅啿鏃犻檺姘存櫠9.9MB游戏下载
-
漫本官方下载9.9MB游戏下载
-
妖精动漫最新版app9.9MB游戏下载
-
deepseek安卓版安装包8.77 MB游戏下载
-
deepseek-R19.25 MB游戏下载
-
大学搜题酱app48.16 MB游戏下载
-
天天练乐乐课堂83.16 MB游戏下载
-
家长通一起作业316.19 MB游戏下载
-
一起作业英语学生版160.33 MB游戏下载
- 推荐游戏玩法
- 暴躁少女为什么如此受欢迎?CS:GO游戏背后隐藏的魅力是什么?揭秘爱奇艺免费观看的秘密
- 《朋友的妈妈》中字头歌词有哪些情感表达与内心世界的揭示?
- Coin Metrics:区块链网络健康入门指南
- 如何在9.1黄金网站平台上进行黄金投资?最全攻略大揭秘!
- 配音演员说漏嘴:《鬼泣3》重制版或开发中!
- 《不戴套的瑜伽教练3》动漫:这一部究竟为何如此受争议?
- Fractal Bitcoin是什么?Fractal Bitcoin网络全面介绍
- 老公刚日完又提出更多要求,妻子该如何回应?如何平衡夫妻间的需求与理解
- 什么是OTC市场?深入解读加密二级OTC市场
- 回顾2024年全部烂梗后,我脑中竟只剩下“踩踩背”
- 最新手机精选
-
jmcomicron.mic天堂安装包2024-12-16游戏下载 | 9.9MB
-
jmcomic2安装包1.7.42025-01-13游戏下载 | 9.97 MB
-
ehviewer漫画2025-01-03游戏下载 | 8.92 MB
-
夏哈塔遭难的一天正式版官网2024-11-23游戏下载 | 11.50M
-
EhViewer官方版绿色2025-01-03游戏下载 | 9.16 MB
-
神话庄园2.0汉化版2024-11-18游戏下载 | 1.79G