DeepSeek首次晒出账单！日赚346万元，理论利润率达545%

2025-03-02 10:49:34

格隆汇

关注

获赞

粉丝

— 分享 —

摘要：一天8.7万美元的成本 vs 56万美元的API收入

周末，DeepSeek又放大招，首次披露大模型的盈利情况，引爆投资圈。

理论利润率达545%

3月1日，DeepSeek发文披露了大规模V3、R1部署的成本和收益，成为了第一个详细披露了自己成本结构的大模型公司。

据DeepSeek计算，运营一天V3和R1的算力成本为87072美元，而以R1定价来看，收入理论上为562027美元，利润率为545%。

据介绍，DeepSeek V3和R1的所有服务均使用H800 GPU，使用和训练一致的精度。

由于白天的服务负荷高，晚上的服务负荷低，因此DeepSeek实现了一套机制。在白天负荷高的时候，用所有节点部署推理服务。晚上负荷低的时候，减少推理节点，以用来做研究和训练。

在2025年02月27日12:00至2025年02月28日12:00，DeepSeek V3和R1推理服务占用节点总和，峰值占用为278个节点，平均占用226.75个节点（每个节点为8个H800 GPU）。假定 GPU 租赁成本为2美金/小时，总成本为87,072美元/天。

在24小时统计时段内，DeepSeek V3和 R1的网页、APP和API的所有负载如下：

输入token总数为608B，其中 342B tokens（56.3%）命中KVCache硬盘缓存。
输出 token总数为168B。平均输出速率为20~22tps，平均每输出一个token的KVCache长度是4989。
平均每台H800的吞吐量为：对于prefill任务，输入吞吐约73.7k tokens/s（含缓存命中）；对于decode任务，输出吞吐约14.8k tokens/s。

如果所有tokens全部按照DeepSeek R1的定价计算，理论上一天的总收入为562,027美元（折合人民币409.36万元），成本利润率545%。