DeepSeek为何一夜爆火
- 种斌Marco
- 2025-01-28 18:42:46
DeepSeek为何一夜爆火因为DeepSeek-R1的优秀
2025年1月20日DeepSeek 发布了 DeepSeek-R1,这是一个推理模型发布。该模型在数学、代码生成和自然语言推理等复杂任务中表现出色,与 OpenAI 的 o1 正式版不相上下。
DeepSeek-R1不仅开源了正式版和6款蒸馏模型,还分享了所有训练细节和方法。这种开放的态度得到了业界的高度评价,被认为是对全球AI界的重大贡献。
DeepSeek-R1在GitHub上的论文发布不到一天就获得了超过5000的收藏,相关话题在YC黑客新闻、Reddit和X等平台的互动量已经过万。许多开发者在社交媒体上分享了使用DeepSeek-R1的经验,例如有人晒出自己使用数小时API后仅0.06美元的账单,也有人分享蒸馏后的模型在M2芯片笔记本上高速运行的画面。
英伟达资深科学家Jim Fan高度评价DeepSeek-R1,认为其展示了所有训练的秘诀。此外,包括UC Berkeley教授Alex Dimakis和Abacus ai CEO Bindu Reddy等在内的多位行业专家也对中国AI的奋起直追表示感叹。
2025年1月20日DeepSeek 发布了 DeepSeek-R1,这是一个推理模型发布。该模型在数学、代码生成和自然语言推理等复杂任务中表现出色,与 OpenAI 的 o1 正式版不相上下。
DeepSeek-R1不仅开源了正式版和6款蒸馏模型,还分享了所有训练细节和方法。这种开放的态度得到了业界的高度评价,被认为是对全球AI界的重大贡献。
DeepSeek-R1在GitHub上的论文发布不到一天就获得了超过5000的收藏,相关话题在YC黑客新闻、Reddit和X等平台的互动量已经过万。许多开发者在社交媒体上分享了使用DeepSeek-R1的经验,例如有人晒出自己使用数小时API后仅0.06美元的账单,也有人分享蒸馏后的模型在M2芯片笔记本上高速运行的画面。
英伟达资深科学家Jim Fan高度评价DeepSeek-R1,认为其展示了所有训练的秘诀。此外,包括UC Berkeley教授Alex Dimakis和Abacus ai CEO Bindu Reddy等在内的多位行业专家也对中国AI的奋起直追表示感叹。