新浪科技讯 3月22日下昼音讯色吧网,腾讯文书推出自研深度想考模子混元T1郑再版,当今已上线腾讯云官网,并行将在腾讯元宝灰度上线。
该模子以腾讯于 2 月底发布的新一代快想考模子混元Turbo S为基座打造,是一款能秒回、吐字快、擅长超长文经管的强推理模子,性能保握业界极端。
通过大限制强化学习,并集结数学、逻辑推理、科学和代码等理科难过的专项优化,混元T1郑再版进一步普及了推理才调。与此前已上线腾讯元宝的混元T1-preview模子比较,玄虚后果彰着普及。
文爱在体现推理模子基础才调的常见benchmark上,如大讲话模子评估增强数据集MMLU-PRO中,混元T1获得87.2分,仅次于o1。在CEval、AIME、Zebra Logic等中英文学问及竞赛级数学、逻辑推理的公开基准测试中,混元T1的得益也达到业界极端推理模子的水平。
此外,T1还在多项对皆任务、教唆跟随任务和用具期骗任务中展现出了极端强的合适性。
混元T1郑再版沿用了混元Turbo S的篡改架构,接受Hybrid-Mamba-Transformer会通花样。这是工业界初次将搀杂Mamba架构无损应用于超大型推理模子。
这一架构有用镌汰了传统Transformer结构的筹画复杂度,减少了KV-Cache的内存占用,从而显耀镌汰了进修和推理本钱,让混元T1结束首字秒出,吐字速率达到最快80 tokens/s。
当今,混元T1郑再版已在腾讯云官网上线,输入价钱为每百万tokens 1元,输出价钱为每百万tokens 4元。(罗宁)
包袱剪辑:常福强 色吧网