织里资讯

搜索
查看: 35|回复: 0

火遍全球的DeepSeek:科学家是怎么用它的?

[复制链接]
发表于 4 小时前|来自:中国广东 | 显示全部楼层 |阅读模式
原文作者:Elizabeth Gibney

科研人员正在测试这个开源模子执行科研任务的能力——从数学一直到认知科学。

DeepSeek的模子能在一个对话机器人app上使用。泉源:Mladen Antonov/AFP via Getty
两周前,一家中国公司推出的DeepSeek-R1让美国股市大幅震荡——DeepSeek-R1是一款平价但强大的人工智能(AI)“推理”模子。


经过反复测试,DeepSeek-R1回复数学和科学题目标能力与o1模子不相上下——o1是由加州旧金山OpenAI公司客岁9月推出的一款模子,OpenAI的推理模子一直被视为行业顶尖水准。


虽然R1在科研人员想尝试的各种任务上仍力有不逮,但它让全球科学家有机会根据其学科内的题目,量身训练定制款的推理模子。


“基于它的绝佳表现和低成本,我们信赖Deepseek-R1能鼓励更多科学家在一样平常科研工作中使用大语言模子(LLM),同时不用担心成本题目,”俄亥俄州立大学的AI研究员Huan Sun说,“险些全部从事AI的同事和合作者都在谈论它。”
开放季
对于科研人员来说,R1的平价和开源可能会改变传统:使用它的应用编程接口(API),就能以其专利竞品收取的一小部分费用对这个模子提问;其在线对话机器人DeepThink(深度思考)的使用更是免费。科研人员还能在本身的服务器上下载这个模子,免费运行和拓展模子——这些都是闭源竞品模子o1办不到的。


R1从1月20日推出以来,“大量研究人员”基于R1或以R1为灵感,尝试训练本身的推理模子,加拿大不列颠哥伦比亚大学的AI研究员Cong Lu说道。这从开放科学AI资源库Hugging Face的数据中便可看出——DeepSeek-R1的代码就储存在Hugging Face上。在模子发布后的一周内,Hugging Face上各版本的R1下载量就超过300万次,包括独立用户已经扩展过的模子。
科研任务
一些初步测试让R1执行数据型科研任务——这些任务选自生物信息、计算化学、认知神经科学等领域的真实论文——效果R1的表现与o1不相上下,Sun说。她的团队让这两个AI模子完成他们创建的一系列题目中的20个任务,这个系列被称为ScienceAgentBench。这些任务包括数据分析和可视化。两个模子只能答对其中约1/3的题目。用API运行R1的成本只要o1的1/13,但R1的“思考”时间比o1更长,Sun说。


R1在数学上也开始崭露头角。英国牛津大学的数学家、计算科学家Frieder Simon让这两个模子给出泛函分析这一抽象领域的一个证明,发现R1的证明比o1的更好。但思量到这类模子通常会犯的错误,如果想要从这些模子中获益,研究人员本身就要具备鉴别证明水平的能力,他说。


R1令人冲动的一大原因在于,它以“open-weight”(开放权重)的情势公开,阐明其算法不同部分之间习得的关联可以进一步拓展。下载了R1或其“蒸馏”小模子(也由DeepSeek发布)的科学家能通过额外训练提拔其能力,这也称为微调。如果有合适的数据集,科研人员或能通过训练,提高该模子在特定科研步调编写代码的能力。


能在当地体系下载并部署R1也是个加分项 ,Sun说,由于如许科研人员就能掌控他们的数据和研究效果。“对于涉及敏感和隐私数据的学科来说,比如医学研究,这一点尤其重要。”
推理跨越
DeepSeek也搅动了AI科研领域,由于它指出了一条能优化无数其他模子的道路,旧金山AI公司Anthropic的联合创始人Jack Clark说。Clark的模子叫Claude。


DeepSeek通过将它的“推理”能力教授给其他大语言模子(LLM)——如Meta的Llama——创建了这个蒸馏模子。DeepSeek在1月22日在arXiv上发布的预印本论文[1]揭示了这背后的方法:用整理好的来自DeepSeek-R1的80万个逐步式“思维链”回复的样本训练这些大语言模子。


“如今网上有了一个开放权重的模子,你能用它让其他充足强大的底子模子变身为一个AI推理器,”Clark在他的简报Import AI中写道,“全球的AI能力又向前了一步。”


科研人员还在应用“强化学习”——用来创建DeepSeek-R1的试、错、赏技术——但打磨它在特定任务上的应用,Lu说。Lu客岁联合创建了“AI Scientist”,这是一个能完成一整套机器学习科研任务的模子,从扫描文献到创建假说再到撰写论文。通过定义适当的“奖赏信号”,科学家能朝着任何目标训练这个模子,他说。


但DeepSeek-R1还远谈不上完美。对话机器人DeepThink在o1等大语言模子会“碰壁”的简单任务上也失败了,这类题目包括统计名字中含字母W的美国州的数量。Lu说:“也许有的人认为这个模子能把水变成酒,这只是炒作,但对于其现实能力来说,它确实是最棒的。”
原文以Scientists flock to DeepSeek: how they’re using the blockbuster AI model标题发表在2025年1月29日《自然》的消息版块上

nature

Doi:10.1038/d41586-025-00275-0

   点击笔墨或图片阅读相关文章
   

版权声明:


来源:https://view.inews.qq.com/k/20250205A03UYP00
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

联系客服 关注微信 下载APP 返回顶部 返回列表