深度求索发布DeepSeek-R1模型‌

大模型之家讯 1月20日，幻方量化旗下AI公司深度求索（DeepSeek）正式发布DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版，且在后训练阶段大规模使用强化学习技术，极大提升推理能力。DeepSeek不仅公开R1训练技术，还蒸馏6个小模型开源给社区。其API价格较o1正式版低27-55倍，每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens 16元。

深度求索发布DeepSeek-R1模型‌

发表回复