强强联合!摩尔线程与国产GPU共塑Deepseek-V3新时代
3月28日消息,日前,DeepSeek宣布DeepSeek V3模型完成小版本升级,版本号为DeepSeek-V3-0324。
27日晚,摩尔线程宣布,其快速响应并成功完成了对DeepSeek-V3的平滑升级,实现了无任何错误报告和兼容性问题的高效部署。
摩尔线程宣布,在Deepseek-V3-0324模型上的光速适配,再一次充分展示了国产全功能GPU在加速大模型产业化进程中的强劲实力。
据了解,DeepSeek-V3-0324模型的参数量较初代V3的6710亿略微提升至6850亿,依旧沿用了混合专家(MoE)架构,每个token平均激活约370亿参数,在推理、编程、数学以及中文处理等领域均表现出行业领先的水准。
根据DeepSeek官方公布的评测结果,DeepSeek-V3-0324在多项能力测试中表现优异。
DeepSeek-V3-0324在性能上不仅远超Claude-3.7-Sonnet和Qwen-Max等顶级模型,还在数学及代码相关的评测集中实现了对GPT-4.5的超越。