Deepseek最近这个热传从一开始就说...

F伯爵
2025-02-05 01:13:33

Deepseek最近这个热传从一开始就说不需要太多算力、只用了两千块GPU、训练成本仅500万美元，咱也不知道消息源在哪？但是从一开始就是这几个关键消息在传播，英伟达股价也应声而跌，我在想难道Deepseek用的不是英伟达？马斯克好像还在X上质疑不是两千块GPU、是用了几万块英伟达的H100，关于这些种种疑问deepseek官方也没出来回应，我在deepseek上提问了一下，图1问它用了哪个品牌的GPU芯片，它说了一堆，大概意思是英伟达+AMD+国产芯片，其中国产芯片比例超过30%，并提到这个满足“信创要求”，这个信创要求可能是国内关于这个行业有使用国产芯片比例的要求；图2我问deepseek用了多少块英伟达GPU，可能我问的太直接它直接装死；图3我问它在图1里提到的英伟达H100集群里使用了多少块H100芯片，它说这个涉及机密不能直说，这也理解，不过它提到这个训练集群是可以扩展到万卡级别的，另外它又提到这个非英伟达比例超过35%；图4我问它是不是训练成本500万，它前面说了一大堆，我就截图最后它的总结：500万美元指的是“预训练阶段的直接GPU成本”，这个术语我不太懂，什么预训练，但后面提到“实际总投入可达数亿甚至10亿美元”。

综上，Deepseek引发的关于算力的讨论，在舆论里我们总是被一开始的媒体或者自媒体宣传的关键词引导，当然主角不出场解释也让此事继续发酵，可能官方想要的就是这种效果吧：猜测、质疑。