消息称DeepSeek R2单位成本下降97.3%，无需英伟达芯片

数码

TIME

2025-04-28 11:18

通信世界网

据量子位消息，DeepSeek R2最新爆料，单位成本下降97.3%，并且摆脱了对英伟达芯片的依赖。具体详情如下。

●单位成本暴降97.3%：训练和推理的单位成本，比GPT-4o下降了惊人的97.3%。传言是输入0.07美元/每百万tokens，输出是0.27美元。

●参数量和训练数据：R2模型参数量达1.2万亿，是R1的两倍。其中活跃参数为78亿，走的是混合专家模型（MoE）路线。另外，R2的训练数据量达5.2PB，覆盖范围极广。

●摆脱英伟达芯片：整个训练完全没用英伟达显卡，而是全部基于华为的Ascend 910B集群。团队自主搭建了分布式训练框架，在浮点16位（FP16）精度下，实测集群算力达到512 PetaFLOPS，集群利用率高达82%，整体性能约为英伟达A100集群的91%。

●性能方面：在最新的C-Eval 2.0评测中，R2取得了89.7%的得分，在COCO图像测试中则实现了92.4%的准确率，展现出强大的综合性能。

●量化压缩技术：DeepSeek R2在8bit精度下，模型体积压缩了83%，而精度损失不到2%，大幅提升了端侧部署的可行性。

值得注意的是，目前上述信息还没有获得内部人士证实。

THE END

免责声明：本文系转载，版权归原作者所有；刊载之目的为传播更多信息，如内容不适请及时通知我们。