消息称DeepSeek R2单位成本下降97.3%,无需英伟达芯片

数码
TIME
2025-04-28 11:18
通信世界网
分享

据量子位消息,DeepSeek R2最新爆料,单位成本下降97.3%,并且摆脱了对英伟达芯片的依赖。具体详情如下。

●单位成本暴降97.3%:训练和推理的单位成本,比GPT-4o下降了惊人的97.3%。传言是输入0.07美元/每百万tokens,输出是0.27美元。

●参数量和训练数据:R2模型参数量达1.2万亿,是R1的两倍。其中活跃参数为78亿,走的是混合专家模型(MoE)路线。另外,R2的训练数据量达5.2PB,覆盖范围极广。

●摆脱英伟达芯片:整个训练完全没用英伟达显卡,而是全部基于华为的Ascend 910B集群。团队自主搭建了分布式训练框架,在浮点16位(FP16)精度下,实测集群算力达到512 PetaFLOPS,集群利用率高达82%,整体性能约为英伟达A100集群的91%。

●性能方面:在最新的C-Eval 2.0评测中,R2取得了89.7%的得分,在COCO图像测试中则实现了92.4%的准确率,展现出强大的综合性能。

●量化压缩技术:DeepSeek R2在8bit精度下,模型体积压缩了83%,而精度损失不到2%,大幅提升了端侧部署的可行性。

值得注意的是,目前上述信息还没有获得内部人士证实。

THE END
免责声明:本文系转载,版权归原作者所有;刊载之目的为传播更多信息,如内容不适请及时通知我们。

相关推荐

1
3