绕开辉达护城河 陆媒传DeepSeek可改适配中国国产GPU芯片

  • 中天電視亞洲台FUN
  • 2025-02-05 04:31:50
绕开辉达护城河 陆媒传DeepSeek可改适配中国国产GPU芯片
据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬件整合技术「统一计算架构」(CUDA)这道AI技术护城河,这种用新的算法高效利用硬件层面加速,能提高模型效果。只要有足够擅长写PTX语言的内部开发者,就能让大陆开发的AI模型更容易适配中国国产GPU芯片,这让美国不少AI巨头们感受到极大的威胁。
据《快科技》报导,DeepSeek真的绕过了辉达的计算架构CUDA,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。
黄雷指出,譬如DeepSeek在多节点通信时绕过了CUDA,直接使用并行线程执行代码(Parallel Thread Excution, PTX),其最多只能实现以算法的方式来高效利用硬件层面的加速。一旦速度变得更快,这就意味着别人的模型要训练10天,而DeepSeek只需要训练5天,那么就能给模型喂更多的数据,即能让模型在同等时间内看到更多的数据,间接提高模型的效果。
因此,透过PTX虽然可以进行更多专门的优化调整,但缺点是很难维持稳定,需要人力大量除错,因此也显示出 Deepseek 工程师的设计功力。
报导说,Deepseek 的出现,打破了硅谷巨头在人工智能竞争中的军备竞赛局面,AI 开发或许不一定非要追求最强芯片和庞大芯片数量,透过精细的程序设计也能让低规设备跑出高效结果,这可能也是前日美国科技股市震荡的主要原因。
报导引述消息人士指出,DeepSeek拥有一些擅长写PTX语言的内部开发者,假如它之后使用中国国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照辉达GPU硬件的程序设计界面去写相关的代码,从而让自家大模型更加容易适配国产硬件。
文章来源:绕开英伟达护城河CUDA!讯息称DeepSeek准备适配国产GPU
新闻来源:中时新闻网
#DeepSeek #GPU #辉达 #CUDA #中国
绕开辉达护城河 陆媒传DeepSeek可改适配中国国产GPU芯片