DeepSeek 公司近日宣布...

爱范儿
2024-11-25 11:24:45

DeepSeek 公司近日宣布，其最新研发的推理模型 DeepSeek-R1-Lite 预览版已正式上线。

该模型通过强化学习训练，具备长思维链推理能力，长度可达数万字，尤其在数学、编程和复杂逻辑推理任务上表现出色，被认为推理效果可与 OpenAI 的 o1-preview 相媲美，甚至能展示 o1 未公开的完整思考过程。

在 AMC 的 AIME 和 codeforces 等国际竞赛评测中，DeepSeek-R1-Lite 超越了 GPT-4o 等知名模型。尽管目前仅支持网页使用，且处于迭代开发阶段，但官方承诺正式版 DeepSeek-R1 模型将完全开源，并提供技术报告及 API 服务，以释放长思维链的全部潜力。