腾讯混元领跑国产大模型，再次逼近全球领先地位

近日，SuperCLUE发布的2024年8月中文大模型基准测评报告显示，腾讯混元大模型再次以强势表现荣登国内榜首，在多个核心任务中展现了强大的竞争力，成为本次测评中进步最快的模型之一。数据显示，在11项能力测评中，腾讯混元在8项任务上排名国内第一，再次证明了其作为国产大模型领导者的地位。

此次测评针对的是腾讯混元新一代大语言模型预览版（Turbo-Preview）。该模型采用了全新的混合专家模型（MoE）结构，依靠自主研发的全链路技术，从训练数据到软硬件体系均实现了重大突破。这不仅大幅提升了模型性能，还显著降低了推理成本，为其在各类应用场景中的广泛使用奠定了坚实基础。

SuperCLUE作为独立的第三方测评机构，本次报告聚焦于模型的通用能力，涵盖了理科、文科和Hard三大维度。其中，理科能力包括计算、逻辑推理和代码能力；文科任务则考察知识百科、语言理解、长文本处理、角色扮演、生成与创作、安全性和工具使用等方面；Hard任务主要评估复杂任务的指令执行及高阶推理能力。在这些维度的评估中，腾讯混元不仅在理科和文科领域稳居第一，甚至在最具挑战性的Hard任务中也取得了国内唯一超过70分的优异成绩，仅与ChatGPT-4o存在1.29%的微小差距。

这一成绩的取得，无疑反映了国产大模型的飞速进化。与国外领先模型相比，国内大模型在中文领域的通用能力差距持续缩小，从2023年5月的30.12%缩小至如今的1.29%。这种快速的进步，不仅意味着国内大模型的技术实力大幅提升，更标志着国产大模型在全球范围内的影响力不断扩大。

自2023年9月腾讯混元正式亮相以来，凭借率先在国内采用MoE结构，模型参数规模已扩展至万亿级别，性能稳步提升。除了在通用能力上的突出表现，腾讯混元在文生图、图生文以及视频生成等多模态能力上也取得了显著进展。在此前SuperCLUE-V中文多模态大模型基准榜单中，腾讯混元凭借卓越的多模态理解能力，成功占据国内榜首，稳居卓越领导者象限。

依托强大的模型能力，腾讯混元正加速推动各类应用落地，目前已接入腾讯内部近700个业务及场景，包括腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等多个产品和服务。此外，腾讯旗下协作SaaS产品也全面接入了腾讯混元大模型，进一步拓展了其在企业服务领域的应用深度。

腾讯云已推出多种版本的混元大模型服务，面向企业和个人开发者全面开放。这些版本包括Turbo-Preview、Pro、Standard、Lite等，不仅支持代码生成、角色扮演等专属模型，还可以通过腾讯云TI平台对模型进行精调。基于腾讯多年来在产业互联网领域的深耕积累，腾讯云已联合行业头部企业，为超过20个行业输出了50多个解决方案，帮助企业高效、优质、低成本地创建和部署AI应用。

在国产大模型快速发展的背景下，腾讯混元凭借其强大的技术能力和广泛的应用落地，正不断缩小与全球领先模型的差距，为国产AI技术的发展注入了新的动力。

DC生肖网

腾讯混元领跑国产大模型，再次逼近全球领先地位

科技小梅爱分享