大模型之家讯 3月22日,腾讯公司宣布其自研深度思考模型混元T1正式版已上线腾讯云官网,并即将在腾讯元宝灰度上线。该模型基于新一代快思考模型混元Turbo S打造,具备秒回、吐字快、擅长超长文处理的特点,在业界保持领先水平。
混元T1通过大规模强化学习,结合数学、逻辑推理、科学和代码等理科难题的专项优化,显著提升了推理能力。与之前的预览版相比,混元T1在MMLU-PRO等基准测试中取得了优异的成绩,仅次于业界标杆o1。此外,在多项对齐任务、指令跟随任务和工具利用任务中也表现出色。
值得一提的是,混元T1正式版沿用了混元Turbo S的创新架构——Hybrid-Mamba-Transformer融合模式。这是首次将混合Mamba架构无损应用于超大型推理模型,有效降低了计算复杂度和内存占用,使得混元T1实现首字秒出,吐字速度最高可达80 tokens/s。
目前,混元T1正式版已在腾讯云官网上线,提供每百万tokens 1元的输入价格和4元的输出价格。这一新模型的推出,无疑为AI领域的研究和应用带来了新的可能性。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/9686