腾讯近日正式推出了其自主研发的深度思考模型——混元T1正式版,该模型已在腾讯云官网上线,面向广大用户提供服务。其中,输入服务的价格为每百万token 1元,输出服务的价格为每百万token 4元。
混元T1正式版以其独特的优势吸引了业界的广泛关注。腾讯方面介绍,该模型具备“吐字快、能秒回”的特点,尤其擅长处理超长文本。作为腾讯自研的强推理模型,混元T1在速度方面表现尤为突出,解码性能在可比参数量下高于行业平均水平2倍,首字秒出,吐字速度可达每秒60至80token,展现了卓越的长文处理能力。
为了进一步提升推理能力,腾讯对混元T1进行了大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题进行了专项优化。这一努力取得了显著成效,在多个评估指标中,混元T1均表现出色。例如,在大语言模型(LLM)评估增强数据集MMLU-PRO中,混元T1取得了87.2分的高分,仅次于OpenAI的o1模型,高于OpenAI GPT 4.5和DeepSeek R1等业界知名模型。
在Ceval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩同样令人瞩目。特别是在逻辑推理方面,混元T1得分93.1,超越了前述多个知名模型,展现了其强大的推理实力。
混元T1正式版的强大推理能力得益于腾讯采用的Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。这一创新使得混元T1在保持高性能的同时,更加经济高效。
在超长文本推理领域,混元T1同样展现出独特优势。凭借其出色的长文捕捉能力,该模型能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时,大幅降低了资源消耗。在相近的激活参数量下,混元T1实现了解码速度提升2倍,进一步提升了其在超长文本推理领域的竞争力。
在上线全新推理模型之前,腾讯混元模型已在海外权威大模型竞技场Chatbot Arena上崭露头角,跻身全球Top 15。这一成绩不仅彰显了腾讯在人工智能领域的实力,也为中国大模型在国际舞台上赢得了更多关注。一同上榜的还有阿里巴巴发布的通义千问最新开源模型QwQ-32B,共同展示了中国在大模型领域的蓬勃发展。
在中文基础能力测试中,腾讯混元同样表现出色。根据本周二发布的《中文大模型测评基准SuperCLUE 3月报告》,腾讯混元位列基础模型国内第二,综合实力稳居国内大模型第一梯队。这一成绩再次证明了腾讯在中文自然语言处理领域的领先地位,也为其在全球市场中的竞争奠定了坚实基础。