DeepSeek发布模型更新,新版本编程能力大大提升

作者: 澎湃新闻   日期:2025-03-25 20:47 阅读:0  来源:澎湃新闻  
分享到:
邮箱:

【天维网综合报道】3月24日晚间,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前已在Hugging Face上开源,并迅速登上了Trending榜单。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,该版本的最新模型也已经同步至官网、App 和小程序,关闭“深度思考”就可体验。

此次发布的版本更新,在性能上,编程能力的优化成了最大亮点,新版本DeepSeek-V3-0324生成前端代码的能力大大提升。

不少自媒体博主在社交平台上发帖认为,DeepSeek-V3-0324 模型在前端代码的生成能力上有了质的提升,审美方面也提升了不少,甚至有博主测评称可以媲美 Claude 3.7 Sonnet思维链版本。有不少用户开始尝试将新模型与此前发布的模型结合解锁新的玩法。有用户称用DeepSeek-V3-0324 模型尝试编写了800多行代码,整个过程没有出现任何故障。“这是免费的、开源的、超快的。很高兴看到这些开源模型如何向大型科技公司施压,以更低的成本构建更好的模型。”该位用户称。

澎湃科技此前曾报道,初代DeepSeek-V3发布于2024年12月26日晚间,这款模型自上线后便以高性价比火速“出圈”。根据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。深度求索表示,“这是一个全新的开始。”其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。


2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。

版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。


2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。

新闻评论须知

· 请您文明上网、理性发言

· 尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任

· 您的留言只代表个人意见,不代表本站立场

· 天维网拥有管理笔名和留言的一切权利

· 您在天维网留言板发表的言论,天维网有权在网站内转载或引用

· 天维网新闻留言板管理人员有权保留或删除其管辖留言中的任意内容

· 参与本留言即表明您已经阅读并接受上述条款

验证码:
×

查看所有评论  共( 条)

Click here

Advertising With Us