Deepseek最近这个热传从一开始就说...
- F伯爵
- 2025-02-05 01:13:33
Deepseek最近这个热传从一开始就说不需要太多算力、只用了两千块GPU、训练成本仅500万美元,咱也不知道消息源在哪?但是从一开始就是这几个关键消息在传播,英伟达股价也应声而跌,我在想难道Deepseek用的不是英伟达?马斯克好像还在X上质疑不是两千块GPU、是用了几万块英伟达的H100,关于这些种种疑问deepseek官方也没出来回应,我在deepseek上提问了一下,图1问它用了哪个品牌的GPU芯片,它说了一堆,大概意思是英伟达+AMD+国产芯片,其中国产芯片比例超过30%,并提到这个满足“信创要求”,这个信创要求可能是国内关于这个行业有使用国产芯片比例的要求;图2我问deepseek用了多少块英伟达GPU,可能我问的太直接它直接装死;图3我问它在图1里提到的英伟达H100集群里使用了多少块H100芯片,它说这个涉及机密不能直说,这也理解,不过它提到这个训练集群是可以扩展到万卡级别的,另外它又提到这个非英伟达比例超过35%;图4我问它是不是训练成本500万,它前面说了一大堆,我就截图最后它的总结:500万美元指的是“预训练阶段的直接GPU成本”,这个术语我不太懂,什么预训练,但后面提到“实际总投入可达数亿甚至10亿美元”。
综上,Deepseek引发的关于算力的讨论,在舆论里我们总是被一开始的媒体或者自媒体宣传的关键词引导,当然主角不出场解释也让此事继续发酵,可能官方想要的就是这种效果吧:猜测、质疑。
综上,Deepseek引发的关于算力的讨论,在舆论里我们总是被一开始的媒体或者自媒体宣传的关键词引导,当然主角不出场解释也让此事继续发酵,可能官方想要的就是这种效果吧:猜测、质疑。