DeepSeek 公司近日宣布...
- 爱范儿
- 2024-11-25 11:24:45
DeepSeek 公司近日宣布,其最新研发的推理模型 DeepSeek-R1-Lite 预览版已正式上线。
该模型通过强化学习训练,具备长思维链推理能力,长度可达数万字,尤其在数学、编程和复杂逻辑推理任务上表现出色,被认为推理效果可与 OpenAI 的 o1-preview 相媲美,甚至能展示 o1 未公开的完整思考过程。
在 AMC 的 AIME 和 codeforces 等国际竞赛评测中,DeepSeek-R1-Lite 超越了 GPT-4o 等知名模型。尽管目前仅支持网页使用,且处于迭代开发阶段,但官方承诺正式版 DeepSeek-R1 模型将完全开源,并提供技术报告及 API 服务,以释放长思维链的全部潜力。
该模型通过强化学习训练,具备长思维链推理能力,长度可达数万字,尤其在数学、编程和复杂逻辑推理任务上表现出色,被认为推理效果可与 OpenAI 的 o1-preview 相媲美,甚至能展示 o1 未公开的完整思考过程。
在 AMC 的 AIME 和 codeforces 等国际竞赛评测中,DeepSeek-R1-Lite 超越了 GPT-4o 等知名模型。尽管目前仅支持网页使用,且处于迭代开发阶段,但官方承诺正式版 DeepSeek-R1 模型将完全开源,并提供技术报告及 API 服务,以释放长思维链的全部潜力。