DeepSeek低调上新:友好度跃升

作者: 21财经   日期:2025-03-26 20:40 阅读:0  来源:21财经  
分享到:
邮箱:

【天维网综合报道】DeepSeek低调发布了DeepSeek-V3模型的更新版本——DeepSeek-V3-0324。

没有主动传播,但引起了AI行业的一阵波澜,一个值得关注的信息点在于,该版本仍然基于V3的模型,改进训练方法后,大幅提高了推理类任务的表现水平,在数学、代码类相关评测集上取得超过GPT-4.5的得分成绩。

多维度性能改进

DeepSeek-V3-0324参数量为6850亿,较上一版本的6710亿略有增加。模型在代码、数学推理等能力上实现了提升,尤其在代码领域表现突出。在Aider的多语言基准测试中,DeepSeek-V3-0324成绩达到55%,较前代版本明显提升,成为仅次于Sonnet 3.7的非推理类模型第二名,代码能力甚至可与Claude 3.7 Sonnet相媲美。

亲民部署与开源升级

除了性能提升,DeepSeek-V3-0324在部署方面也表现出优势。该版本模型采用宽松的MIT开源协议,且可直接部署在M3 Ultra的Mac Studio上,这意味着大模型开发应用的门槛更进一步降低。苹果机器学习工程师Awni Hannun 基于MLX框架和4-bit量化,在 512GB M3 Ultra上实现了超过20 token/s的运行速度,将模型磁盘占用空间减少到352GB。

相比之前的自定义许可证,新协议还支持开发者自由修改、分发模型,支持模型蒸馏和商业化应用,进一步推动了AI技术的共享与创新。

冲击行业格局

从国内市场来看,AI领域“六小龙”在DeepSeek的冲击下出现分化。Quest Mobile1月数据显示,当月DeepSeek日活超越豆包,Kimi退居第三,月之暗面受到的冲击较为明显。而腾讯因全面拥抱DeepSeek,在基础模型领域实现追赶。

在国际市场,DeepSeek的技术突破也引发了诸多讨论。英伟达因DeepSeek的热度,股价震荡下行,投资者担忧DeepSeek的技术进步会降低市场对英伟达昂贵硬件的需求,以至于黄仁勋近日在GTC大会上特意强调:“DeepSeek带来的并不是硬件需求的减少,反而会推动对强大硬件的需求。”黄仁勋话音刚落,传来腾讯增购数十亿元芯片的消息,这些需求主要就是包括布置DeepSeek在内的大模型带来的。

与此同时,业内共识在于,DeepSeek的火爆,表明中国在基础设施软件工程等领域取得了领先地位。

此次DeepSeek-V3-0324的更新,并非市场此前期待的DeepSeek-V4或R2。但从发布时间和技术特点来看,市场猜测,DeepSeek-R2有可能在不久后上线。R2有望进一步提升模型的推理能力,持续改写AI产业的竞争格局,推动各行业智能化变革走向深入。

版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。


2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。

版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。


2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。

新闻评论须知

· 请您文明上网、理性发言

· 尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任

· 您的留言只代表个人意见,不代表本站立场

· 天维网拥有管理笔名和留言的一切权利

· 您在天维网留言板发表的言论,天维网有权在网站内转载或引用

· 天维网新闻留言板管理人员有权保留或删除其管辖留言中的任意内容

· 参与本留言即表明您已经阅读并接受上述条款

验证码:
×

查看所有评论  共( 条)

Click here

Advertising With Us