DeepSeek开源第三日,行业影响几何?
作者: 第一财经 日期:2025-02-26 20:27 阅读:0 来源:第一财经
【天维网综合报道】2月26日,在开源周(OpenSourceWeek)第三日,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。
DeepSeek这三天的发布都与算法有关,偏技术向。大模型生态社区OpenCSG(开放传神)创始人陈冉对第一财经举例表示,“相当于以前DeepSeek是直接给一辆车,告诉大家这辆车续航900公里,但是现在DeepSeek在深挖,用什么方式能够开到900公里。”DeepSeek的模型为什么能够实现较好的效果,对应有一些算法和相应的框架,而这些“脚手架”的开源有利于之后的生态搭建。
具体到此次发布的关键词,GEMM(General Matrix Multiplication,通用矩阵乘法)是线性代数中的基本运算,而FP8 GEMM则是一种使用8位浮点数进行矩阵乘法的计算操作。FP8是一种低精度浮点格式,适用于深度学习和高性能计算,能够在保持较高计算效率的同时减少内存占用和带宽需求。
据DeepSeek方面介绍,DeepGEMM同时支持传统的稠密模型和MoE(混合专家)模型的GEMM运算,这一代码为基于英伟达Hopper架构(如H100 GPU)的V3/R1系列硬件提供高效的训练和推理支持。
DeepSeek提到,基于这一代码库,在英伟达Hopper架构的GPU上可实现1350+ FP8 TFLOPS(每秒浮点运算次数)的性能,充分利用算力。同时,该代码库设计非常简洁,只有一个核心内核函数,代码量约为300行,但在大多数矩阵规模上均优于专家调优的内核。
开源 DeepGEMM有何影响?记者将此问题抛给DeepSeek,它回答称,DeepGEMM 通过FP8和硬件级优化,解决了大模型计算效率和资源消耗的痛点,尤其为 MoE模型的落地提供了关键支持。其开源行为不仅加速了技术民主化,更可能成为AI计算生态的“基础设施”,推动行业向更高效、低成本的方向发展。
FP8是AI计算的新兴标准,其高效性可加速千亿参数模型的训练,降低显存需求。在边缘设备或云端部署时,FP8的低精度计算能显著提升吞吐量,降低成本。因此,开源 DeepGEMM可以推动FP8生态普及,降低开发者使用门槛,促进更多框架和模型适配FP8,加速行业向低精度计算迁移。
此外,MoE模型因计算复杂性难以落地,DeepGEMM 的开源提供了高效实现参考,可能催生更多MoE应用(如多模态模型、边缘端高效模型)。
对于DeepSeek连续三天的代码库开源,陈冉对记者表示,“我们看下来蛮震撼的。”DeepSeek最终的目标是要表明他们的R1和V3是怎么做出来的,他认为,DeepSeek现在发布的算法某种意义上属于“脚手架”,“一定要给大家‘脚手架’,才能真正让大家基于DeepSeek的技术线继续往前用,最终行业能基于此将生态做起来。”
长期来看,陈冉认为,DeepSeek这一开源动作非常有意义,既有模型标准,也有工具标准,也有生态基石,生态才能长起来。
陈冉判断,DeepSeek的代码开源或许会影响一批做AI Infra层的从业者,“DeepSeek基本将技术栈、模型给出来,就差数据了,但是别人也有可能将数据复现出来,AI Infra层的人就要找新的方向。”但他同时表示,这种开源是一把双刃剑,如果能将DeepSeek开源的内容用好可能也会得利,“用不好就被冲击”。
也有从业者对记者表示,DeepSeek开源的是Infra层的推理加速这一块,DeepSeek底层技术开源对从业者有影响,但或许不会太大。
“DeepSeek对行业的影响这才刚刚开始,没有人能猜到结局。”上述从业者说。
DeepSeek在此前宣布会陆续开源5个代码库,接下来DeepSeek还有两个代码库在这周发布。“每分享一行代码,都会成为加速AI行业发展的集体动力。”DeepSeek在公告中表示。
版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。
2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。
版权声明
1.
未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。
2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。
- 香港迪士尼2024财年净利润8.38亿港元,为开业以来最高
- DeepSeek光芒盖过“六小龙”,大模型的天平往哪里倾斜了?
- “ABC”三分天下,储能电池国际格局生变
- 专访BCA Research欧洲投资首席策略师:全球机械贸易将迎来转折点,利好德国|德国经济见闻录
- “DeepSeek没必要成为中国版OpenAI,因为OpenAI也不是大模型终局”
- 领英谈AI时代企业用人:2030年70%岗位需求将变化
- 特朗普将推出“金卡” 取代现有投资移民计划
- 特斯拉向中国车主推出期待已久的自动辅助驾驶功能
- 喝了酒去考科目三,交警都惊呆了
- 阿里将发布视频生成人工智能模型Wan 2.1开源版本
· 请您文明上网、理性发言
· 尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任
· 您的留言只代表个人意见,不代表本站立场
· 天维网拥有管理笔名和留言的一切权利
· 您在天维网留言板发表的言论,天维网有权在网站内转载或引用
· 天维网新闻留言板管理人员有权保留或删除其管辖留言中的任意内容
· 参与本留言即表明您已经阅读并接受上述条款
查看所有评论 共( 条)