腾讯混元T1正式版发布,深度思考能力媲美DeepSeek-R1,价格更亲民

腾讯混元T1正式版发布,深度思考能力媲美DeepSeek-R1,价格更亲民

作者:编辑 发表时间:2025-03-22 15:04

腾讯正式发布混元-T1深度思考模型,强化推理能力引关注

近日,腾讯公司正式推出了其混元大模型系列中的深度思考模型——混元-T1正式版。这一新版本在推理能力上实现了显著提升,引发了业界广泛关注。

混元-T1是腾讯自研的一款强推理模型,其吐字速度高达60~80token/s,在实际应用中展现出了比DeepSeek-R1更快的生成效果。这一模型的升级基于腾讯混元团队在3月初发布的业界*超大规模Hybrid-Transformer-Mamba MoE大模型TurboS快思考基座,通过大规模后训练进一步扩展了推理能力,并实现了与人类偏好的对齐。

据了解,混元-T1的前身是今年2月中旬在腾讯元宝APP上线的混元T1-Preview推理模型。相比于预览版,正式版在技术上实现了多项突破,特别是在混合Mamba架构的应用上,这是工业界首次将这一架构无损应用于超大型推理模型,有效降低了计算复杂度和内存占用。

在多个公开数据集的评测中,混元-T1在MMLU-pro、Ceval、AIME、Zebra Logic等中英文知识和竞赛级数学、逻辑推理指标上均表现出色,基本持平或略超R1。这一成绩不仅验证了混元-T1的推理能力,也展示了腾讯在人工智能领域的深厚技术积累。

在实际应用中,混元-T1展现出了强大的复杂指令跟随能力、长文摘要能力和角色扮演能力。在知识问答场景中,混元-T1能够快速准确地回答各种问题,包括理科数学推理、复杂指令跟随等难题。同时,它还能够作为生产力工具,提升用户的工作效率,如生成朋友圈文案、总结新闻报道等。

混元-T1在腾讯内部人工体验集评估中也表现出色,其中在文创指令遵循、文本摘要、Agent能力方面略胜于R1。这一成绩进一步验证了混元-T1的实用性和可靠性。

目前,混元-T1已在腾讯云上线,提供输入和输出服务。其输入价格为每百万tokens 1元,输出价格为每百万tokens 4元,这一价格与DeepSeek优惠时段一致,为用户提供了更加经济高效的选择。

相关文章
更多