DeepSeek为何一夜爆火

种斌Marco
2025-01-28 18:42:46

DeepSeek为何一夜爆火因为DeepSeek-R1的优秀

2025年1月20日DeepSeek 发布了 DeepSeek-R1，这是一个推理模型发布。该模型在数学、代码生成和自然语言推理等复杂任务中表现出色，与 OpenAI 的 o1 正式版不相上下。

DeepSeek-R1不仅开源了正式版和6款蒸馏模型，还分享了所有训练细节和方法。这种开放的态度得到了业界的高度评价，被认为是对全球AI界的重大贡献。

DeepSeek-R1在GitHub上的论文发布不到一天就获得了超过5000的收藏，相关话题在YC黑客新闻、Reddit和X等平台的互动量已经过万。许多开发者在社交媒体上分享了使用DeepSeek-R1的经验，例如有人晒出自己使用数小时API后仅0.06美元的账单，也有人分享蒸馏后的模型在M2芯片笔记本上高速运行的画面。

英伟达资深科学家Jim Fan高度评价DeepSeek-R1，认为其展示了所有训练的秘诀。此外，包括UC Berkeley教授Alex Dimakis和Abacus ai CEO Bindu Reddy等在内的多位行业专家也对中国AI的奋起直追表示感叹。