DeepSeek的全球影响力:科学家如何应用这一创新工具

华远系统

在科技日新月异的今天,一款名为DeepSeek-R1的人工智能(AI)“推理”模型犹如一股清流,迅速席卷了全球科研界。这款由中国公司推出的平价而强大的模型,不仅在数学、科学领域展现出了与OpenAI的o1模型相媲美的能力,更以其开源、低成本的特性,为科研人员开辟了一条全新的研究路径。


自DeepSeek-R1于1月20日面世以来,它便成为了科研人员竞相探索的热门话题。俄亥俄州立大学的AI研究员Huan Sun表示:“基于DeepSeek-R1的卓越表现和低廉成本,我们相信它将激励更多科学家在日常科研工作中大胆采用大语言模型(LLM),而无需为高昂的费用担忧。如今,几乎每一位从事AI研究的同事和合作者都在热烈讨论这款模型。”

DeepSeek-R1的开源特性,无疑为科研人员带来了前所未有的便利。他们可以通过使用其应用编程接口(API),以远低于专利竞品的价格向模型提问。更令人振奋的是,其在线对话机器人DeepThink的使用完全免费。此外,科研人员还能在自己的服务器上下载并运行这款模型,进行自由拓展——这是闭源竞品o1所无法比拟的。


自推出以来,DeepSeek-R1已经激发了全球科研人员的无限创意。加拿大不列颠哥伦比亚大学的AI研究员Cong Lu透露,已有“大量研究人员”基于R1或以R1为灵感,尝试训练自己的推理模型。从开放科学AI资源库Hugging Face的数据中便可窥见一斑:在模型发布后的一周内,Hugging Face上各版本的R1下载量便突破了300万次大关,其中包括独立用户已经扩展过的模型。


在初步测试中,DeepSeek-R1被赋予了执行数据型科研任务的重任——这些任务均选自生物信息、计算化学、认知神经科学等领域的真实论文。结果显示,R1的表现与o1难分伯仲。Sun的团队设计了一系列名为ScienceAgentBench的问题,包括数据分析和可视化等20个任务,让两个AI模型进行挑战。结果显示,两个模型均只能正确回答其中约1/3的问题。尽管R1的“思考”时间比o1更长,但使用API运行R1的成本却仅为o1的1/13。


在数学领域,DeepSeek-R1同样展现出了非凡的潜力。英国牛津大学的数学家、计算科学家Frieder Simon让两个模型对泛函分析这一抽象领域的证明进行尝试,发现R1给出的证明甚至优于o1。然而,Simon也提醒道,考虑到这类模型通常会犯的错误,研究人员自身必须具备鉴别证明水平的能力,才能从模型中获益。


DeepSeek-R1之所以令人激动不已,还在于其以“开放权重”的形式公开。这意味着其算法不同部分之间习得的关联可以进一步拓展。下载了R1或其“蒸馏”小模型的科学家,可以通过额外训练提升其能力,这一过程也被称为微调。如果有合适的数据集,科研人员或许能通过训练,提高该模型在特定科研步骤中编写代码的能力。
能够在本地系统下载并部署R1,无疑为科研人员提供了更大的灵活性。Sun强调,这样一来,科研人员便能更好地掌控他们的数据和研究结果。“对于涉及敏感和隐私数据的学科来说,比如医学研究,这一点尤为重要。”


DeepSeek的出现,不仅为科研人员提供了强大的工具,更是指出了一条优化无数其他模型的道路。旧金山AI公司Anthropic的联合创始人Jack Clark对此深有感触。他表示,DeepSeek通过将“推理”能力教授给其他大语言模型(如Meta的Llama),创建出了蒸馏模型。这一方法揭示了如何用整理好的来自DeepSeek-R1的80万个逐步式“思维链”回答的样本,来训练这些大语言模型。


“现在,网上有了一个开放权重的模型,你能够利用它让其他足够强大的基础模型摇身一变,成为一个AI推理器。”Clark在他的简报Import AI中写道,“这无疑标志着全球AI能力的一次重大飞跃。”
科研人员还在积极探索“强化学习”的应用,即利用试、错、赏技术来打磨DeepSeek-R1在特定任务上的应用。Lu指出,去年他联合创建了“AI Scientist”模型,这是一个能够完成一整套机器学习科研任务的强大工具,从扫描文献、创建假说,到撰写论文,无所不能。通过定义适当的“奖赏信号”,科学家可以朝着任何目标训练这个模型。


然而,我们也不得不正视DeepSeek-R1的局限性。对话机器人DeepThink在某些简单任务上也会“碰壁”,比如统计名字中含字母W的美国州的数量。对此,Lu坦言:“或许有人会觉得这款模型能点石成金,但这只是炒作而已。不过,就其实际能力而言,它确实已经相当出色了。”


尽管存在不足,但DeepSeek-R1无疑为科研领域带来了革命性的变化。它以其开源、平价、强大的特性,成为了科研人员探索未知、攻克难题的新利器。随着科研人员对DeepSeek-R1的深入研究与广泛应用,我们有理由相信,这款模型将在未来绽放出更加璀璨的光芒。
此外,DeepSeek-R1的成功也为我们提供了一个宝贵的启示:在科技创新的道路上,开放与合作是推动进步的重要动力。只有打破壁垒、共享资源,才能激发无限的创造力与可能性。未来,我们期待看到更多像DeepSeek-R1这样的创新成果涌现,为人类的科技进步贡献智慧与力量。