大模型之家讯 1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式发布DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版,且在后训练阶段大规模使用强化学习技术,极大提升推理能力。DeepSeek不仅公开R1训练技术,还蒸馏6个小模型开源给社区。其API价格较o1正式版低27-55倍,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。
大模型之家讯 1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式发布DeepSeek-R1模型。该模型在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版,且在后训练阶段大规模使用强化学习技术,极大提升推理能力。DeepSeek不仅公开R1训练技术,还蒸馏6个小模型开源给社区。其API价格较o1正式版低27-55倍,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。