从NVIDIA到华为:DeepSeek R2重磅升级,引领AI芯片新纪元
4月29日消息,年初DeepSeekR1的发布在国际AI领域掀起了巨大波澜,不仅让美国AI行业感受到强烈的震动,甚至导致NVIDIA的股价出现显著波动。可以预见,随着更强大的DeepSeekR2即将登场,全球科技格局或将再次迎来新的变化。 在我看来,DeepSeekR系列的每一次迭代都不仅仅是技术上的突破,更是对现有技术壁垒的一次有力冲击。它不仅展示了中国在人工智能领域的强劲实力,同时也提醒我们,技术创新正在以惊人的速度重塑全球竞争态势。面对这样的挑战,无论是企业还是国家都需要更加敏锐地把握趋势,积极拥抱变革,才能在全球化的竞争中占据有利位置。未来,如何平衡技术发展与伦理规范之间的关系,将是DeepSeekR2乃至整个AI行业需要共同思考的问题。
据报道,市场最新消息显示,R2大模型即将面世,该模型将引入更先进的混合专家模型(MoE)架构,其总参数量相比R1提升了近一倍,预计将达到1.2万亿规模(R1的参数量为6710亿)。同时,R2的单位推理成本相较于GPT-4大幅降低了97.4%。这一突破性进展不仅标志着人工智能技术在效率与性能上的又一次飞跃,也预示着未来AI应用的成本门槛将进一步降低。可以预见的是,在如此强大的算力支持下,R2将在多个领域展现出更为卓越的表现,而其经济性和实用性也将吸引更多企业和开发者加入生态建设。这不仅是技术层面的进步,更是推动AI普惠化的重要一步。
当下,中美科技战、贸易战愈演愈烈,NVIDIA H20芯片面临新一波出口管制。
在DeepSeek R2预期发布时间临近的情况下,各界高度关注中国指标性大模型在缺乏美国芯片资源下的发展动向。
据传,R2规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,还将结合更智能的门控网络层(Gating Network),进而优化高负载推理任务的性能。
消息指出,R2将完全脱离NVIDIA芯片的依赖,整个训练过程均未采用NVIDIA显卡,而是基于昇腾910B(Ascend910B)芯片构建的集群平台进行。在FP16精度下,该集群的计算性能达到512PetaFLOPS,芯片利用率为82%,整体性能相当于NVIDIA上一代A100集群的91%左右。
市场预期,这一进展或将减少中国在高端AI芯片领域对国外的依赖,同时华为全新推出的昇腾910C芯片也已进入大规模量产环节。
成本方面,DeepSeek-R2的单位推理成本相比OpenAI的GPT-4降低了97.4%。具体而言,DeepSeek-R2的输入每百万个字符费用仅为0.07美元,输出每百万个字符费用为0.27美元。
分析认为,有消息称R2表现十分强劲,这或许会重新引发市场对于AI基础设施需求的疑虑。与此同时,随着华为在AI芯片领域的国产化替代进程加快,NVIDIA或将面临更大的竞争压力。