Nature:连发3篇文章感叹DeepSeek震惊世界

2025-02-02 生物世界 生物世界 发表于威斯康星

来源:生物世界

来源:生物世界

最近,一家来自中国杭州的初创公司深度求索(DeepSeek)凭借发布的两款大语言模型(LLM),在全世界科技界掀起波澜,这两款模型的性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却只是其一小部分。

2025 年 1 月 20 日,DeepSeek 发布了 DeepSeek-R1,这是一个部分开源(训练数据未公开,因此并非完全开源)的“推理”模型,能够以与 OpenAI 于 2024 年年底发布的最先进的专注于“推理”的大语言模型 GPT-o1 相近的水平解决一些科学问题。

几天后的 1 月 28 日,DeepSeek 推出了另一款模型——Janus-Pro-7B,能够根据文本提示生成图像,也就是所谓的“文生图”,其性能与 OpenAI 的 DALL-E 3 以及 Stability AI 的 Stable Diffusion 相当。

国际顶尖学术期刊 Nature 在其官网连续发布了 3 篇文章报道 DeepSeek。

1 月 29 日,Nature 发布了题为:Scientists flock to DeepSeek: how they’re using the blockbuster AI model 的新闻文章。

Image

该文章指出,科学家们正在纷纷涌入 DeepSeek,从 AI 专家到数学家再到认知神经学家,他们为 DeepSeek-R1 的高性能和低成本所惊叹

1 月 30 日,Nature 发布了题为:China’s cheap, open AI model DeepSeek thrills scientists 的新闻文章。

Image

该文章指出,来自中国的便宜的、开放的 AI 模型 DeepSeek 让科学家们兴奋不已,DeepSeek-R1 执行推理任务的水平与 OpenAI 的 GPT o1 相当,而关键是,DeepSeek-R1 向研究人员开源。科学界认为,DeepSeek 的开放非常令人震惊,相比之下,OpenAI 推出的 GPT o1 以及最新成果 o3,基本上都是黑匣子。

当然,DeepSeek-R1 令人印象深刻的还包括其超低成本,DeepSeek 尚未公布训练 DeepSeek-R1 的全部成本,但据估计,训练 DeepSeek-R1 所需的算力租赁费用约为 600 万美元,相比之下,Meta 公司训练 Llama 3.1 405B 的算力是其 11 倍,训练成本超过 6000 万美元。尽管美国限制了中国公司获取用于人工智能的最先进的计算机芯片,但 DeepSeek-R1 还是成功了,这也说明了高效利用资源比单纯依靠计算规模更为重要。这也表明了美国在人工智能领域的建立的优势正在快速缩小。

此外,使用 DeepSeek-R1 界面的用户只需支付运行 ChatGPT o1 费用的不到三十分之一(10美元 vs 370 美元)。此外,DeepSeek 还创建了 DeepSeek-R1 的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

1 月 30 日,Nature 发布了题为:How China created AI model DeepSeek and shocked the world 的新闻文章。

Image

该文章分析了中国是如何创造出震惊世界的 AI 模型 DeepSeek,文章中指出,政策支持大量资金,以及大量的 AI 专业人才,帮助中国企业建立了先进的大语言模型。

如果 DeepSeek-R1 的表现让中国以外的许多人感到惊讶,但国内的研究人员表示,这家初创企业的成功在意料之中,也符合政府成为全球人工智能(AI)领导者的雄心。

中国科学院计算技术研究所副所长陈云霁研究员表示,鉴于中国在开发大语言模型的公司上投入了巨额风险资本,且拥有众多在科学、技术、工程或数学领域(包括人工智能)拥有博士学位的人才,像 DeepSeek 这样的公司在中国出现是不可避免的。即便不是 DeepSeek,中国也会有其他大语言模型能够做出一番成就。

事实上,也确实有。

1 月 29 日,科技巨头阿里巴巴发布了其迄今为止最先进的大语言模型——Qwen2.5-Max(通义千问旗舰版),并称其性能优于 GPT-4o、DeepSeek-V3 以及 Llama-3.1-405B。而上周,月之暗面联合字节跳动发布了新的推理模型 Kimi 1.5Kimi 1.5 1.5-pro,并称其在某些基准测试中的表现优于 GPT-o1。

参考资料

https://www.nature.com/articles/d41586-025-00275-0

https://www.nature.com/articles/d41586-025-00229-6

https://www.nature.com/articles/d41586-025-00259-0

 

评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2250265, encodeId=76772250265f8, content=科学技术可能会**我们的认知, beContent=null, objectType=article, channel=null, level=null, likeNumber=36, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=b4406448235, createdName=刘桂林, createdTime=Sun Feb 02 07:01:39 CST 2025, time=2025-02-02, status=1, ipAttribution=辽宁省), GetPortalCommentsPageByObjectIdResponse(id=2250261, encodeId=c7a12250261f6, content=<a href='/topic/show?id=d3a024808e0' target=_blank style='color:#2F92EE;'>#人工智能#</a> <a href='/topic/show?id=ce08123e6822' target=_blank style='color:#2F92EE;'>#deepseek#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=19, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=123768, encryptionId=ce08123e6822, topicName=deepseek), TopicDto(id=24808, encryptionId=d3a024808e0, topicName=人工智能)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Sun Feb 02 04:25:07 CST 2025, time=2025-02-02, status=1, ipAttribution=威斯康星)]
    2025-02-02 刘桂林 来自辽宁省

    科学技术可能会**我们的认知

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=2250265, encodeId=76772250265f8, content=科学技术可能会**我们的认知, beContent=null, objectType=article, channel=null, level=null, likeNumber=36, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=b4406448235, createdName=刘桂林, createdTime=Sun Feb 02 07:01:39 CST 2025, time=2025-02-02, status=1, ipAttribution=辽宁省), GetPortalCommentsPageByObjectIdResponse(id=2250261, encodeId=c7a12250261f6, content=<a href='/topic/show?id=d3a024808e0' target=_blank style='color:#2F92EE;'>#人工智能#</a> <a href='/topic/show?id=ce08123e6822' target=_blank style='color:#2F92EE;'>#deepseek#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=19, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=123768, encryptionId=ce08123e6822, topicName=deepseek), TopicDto(id=24808, encryptionId=d3a024808e0, topicName=人工智能)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Sun Feb 02 04:25:07 CST 2025, time=2025-02-02, status=1, ipAttribution=威斯康星)]
    2025-02-02 梅斯管理员 来自威斯康星

相关资讯

梅斯评测:Deepseek与chatGPT在医疗中对决,谁将胜出?

人工智能已不再是科幻作品中的遥远设想,而是切切实实地融入到了社会的每一个角落,成为推动经济发展、社会进步和科技创新的核心力量。从智能手机中的语音助手,到医疗领域的智能诊断系统;从金融行业的风险预测模型

人工智能在药物开发中的应用现状

AI 在药物开发领域作用显著,能加速药物发现、实现药物重新利用与组合、促进分子从头合成及优化临床试验设计。不过,其应用仍面临诸多挑战,目前还未带来革命性变革。

人工智能将如何改变现有肿瘤学研究

本文阐述 AI 在肿瘤学研究中从深度学习模型到多模态模型,再到 AI 自主代理模型的转变,探讨其应用前景,强调评估性能、制定规则的重要性。

OpenAI推出AI智能体——Operator ,能像人类一样操作电脑,预计今年底会成为常态

2024年10月份,Claude 3.5 Sonnet,推出一项突破性新功能:计算机使用能力(computer use)。开发者可以指导 Claude 像人类一样使用电脑,如查看屏幕、移动鼠标、点击按

综述|人工智能技术在抑郁症临床管理中的研究进展

本文旨在为人工智能技术更好地应用于抑郁症临床管理提供新的思路和依据。

专访王雁教授:AI技术在圆锥角膜早期诊断中的应用 | 2025年中国“海上之光”眼视光学与视觉科学学术会议

梅斯医学特邀来自天津市眼科医院王雁教授对AI与圆锥角膜早期诊断议题进行精彩分享。

JNM:麻醉复苏室工作人员对使用人工智能系统的需求

受访者大多赞成实施机器学习系统,并强调了护士管理人员在患者工作流程和安全方面的关键作用,指出数字化可以提供实质性的帮助。

Translational Psychiatry:语音特征揭示自闭症真相,ASDSpeech算法在大规模数据集上的突破性应用

ASDSpeech算法能够准确估算自闭症儿童的社交症状严重性,并且具备临床应用的潜力,特别是通过将该算法与眼动追踪、面部表情和身体运动等数据结合使用,可以进一步提高其准确性和可靠性。

Nature:人工智能成功设计出强效抗蛇毒抗体

据世界卫生组织统计,蛇毒复杂且致命,全球每年有 180 万至 270 万人受毒蛇咬伤影响,约 10 万人丧生,30 万人永久性残疾,尤其对资源匮乏地区的公共卫生安全构成挑战。一直以来,蛇毒治疗主要依赖

大幅减轻医生负担!人工智能用于电子医疗记录虽好,但专家发现了这五个重大危险

本文章提醒医生和科学家在应用人工智能大语言模型生成电子医疗记录(EHR)文档时需谨慎,应充分评估其对医疗记录质量和临床推理的影响。