DeepSeek携手华为芯片,开启FP8算力新时代
8月25日,据报道,深度求索正式推出DeepSeek-V3.1。其中一项重要的突破和令人惊喜的进展,是新增了对UE8M0FP8的支持。
DeepSeek在其官方发布的文章中提到,UE8M0FP8是为即将推出的下一代国产芯片所设计的。这一信息表明,随着国产芯片技术的不断进步,相关软件和算法也在同步进行适配与优化,以更好地发挥硬件性能。从技术发展的角度来看,这种协同推进的方式有助于提升整体系统的效率与稳定性,也反映出国内在AI基础设施建设方面的持续投入与布局。
东莞证券指出,该格式通过更高的灵活度支持复杂模型推理,提升芯片的解码效率与运算能力,为国产芯片适配更大模型提供技术路径,国产AI算力生态有望加速成型。
那UE8M0 FP8到底是什么?将有何影响?
人工智能领域的企业家与技术专家、清华大学计算机系人工智能所博士梁斌表示,DeepSeek这次为什么非要强调UE8M0 FP8呢?这个和英伟达的FP8是两个东西,两套标准。
他解释称,显存的容量是有限的,而模型的规模却在快速扩张,因此必须通过量化技术对每个参数进行压缩。FP32表示用32位来表示一个参数,FP8则是用8位来表示一个参数。在可接受的精度范围内,位数越低,显存中就能容纳更多的参数。
FP8格式存在两种不同的实现方案,分别是英伟达的E4M3/E5M2以及DS的UE8M0。两者的主要差异在于前者支持3位或2位的小数表示,而后者则不包含小数部分。从性能上看,英伟达的方案具有更高的精度,而DS的方案则在功耗、运算速度以及对芯片的要求方面更具优势。
梁斌表示,目前,DeepSeek已支持UE8M0FP8标准,同时国产芯片厂商也逐步向这一标准靠拢,这标志着其与英伟达的路线彻底分道扬镳。未来其他推理模型,要么采用DeepSeek的这套技术体系,要么依赖英伟达的方案,国内芯片企业也在积极融入这套标准。
如今华为为了适配这一标准,确实全力以赴,拼尽全力,成功的话就能名留青史,这种诱惑非常巨大。同时,我也发现DeepSeek确实有勇气,真正将国产大模型的发展推上了一个令人瞩目的高度,实在是太厉害了。