绕开辉达护城河陆媒传DeepSeek可改适配中国国产GPU芯片

中天電視亞洲台FUN
2025-02-05 04:31:50

绕开辉达护城河陆媒传DeepSeek可改适配中国国产GPU芯片
据外媒报导，深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬件整合技术「统一计算架构」(CUDA)这道AI技术护城河，这种用新的算法高效利用硬件层面加速，能提高模型效果。只要有足够擅长写PTX语言的内部开发者，就能让大陆开发的AI模型更容易适配中国国产GPU芯片，这让美国不少AI巨头们感受到极大的威胁。
据《快科技》报导，DeepSeek真的绕过了辉达的计算架构CUDA，北京航空航天大学黄雷副教授接受采访时表示，绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的开发，从而实现更加细粒度的操作。
黄雷指出，譬如DeepSeek在多节点通信时绕过了CUDA，直接使用并行线程执行代码（Parallel Thread Excution, PTX），其最多只能实现以算法的方式来高效利用硬件层面的加速。一旦速度变得更快，这就意味着别人的模型要训练10天，而DeepSeek只需要训练5天，那么就能给模型喂更多的数据，即能让模型在同等时间内看到更多的数据，间接提高模型的效果。
因此，透过PTX虽然可以进行更多专门的优化调整，但缺点是很难维持稳定，需要人力大量除错，因此也显示出 Deepseek 工程师的设计功力。
报导说，Deepseek 的出现，打破了硅谷巨头在人工智能竞争中的军备竞赛局面，AI 开发或许不一定非要追求最强芯片和庞大芯片数量，透过精细的程序设计也能让低规设备跑出高效结果，这可能也是前日美国科技股市震荡的主要原因。
报导引述消息人士指出，DeepSeek拥有一些擅长写PTX语言的内部开发者，假如它之后使用中国国产GPU，其在硬件适配方面将会更得心应手，其只要了解这些硬件驱动提供的一些基本函数接口，就可以仿照辉达GPU硬件的程序设计界面去写相关的代码，从而让自家大模型更加容易适配国产硬件。
文章来源：绕开英伟达护城河CUDA！讯息称DeepSeek准备适配国产GPU
新闻来源：中时新闻网
#DeepSeek #GPU #辉达 #CUDA #中国