腾讯混元领跑国产大模型,再次逼近全球领先地位

科技小梅爱分享 2024-09-05 11:48:42

近日,SuperCLUE发布的2024年8月中文大模型基准测评报告显示,腾讯混元大模型再次以强势表现荣登国内榜首,在多个核心任务中展现了强大的竞争力,成为本次测评中进步最快的模型之一。数据显示,在11项能力测评中,腾讯混元在8项任务上排名国内第一,再次证明了其作为国产大模型领导者的地位。

此次测评针对的是腾讯混元新一代大语言模型预览版(Turbo-Preview)。该模型采用了全新的混合专家模型(MoE)结构,依靠自主研发的全链路技术,从训练数据到软硬件体系均实现了重大突破。这不仅大幅提升了模型性能,还显著降低了推理成本,为其在各类应用场景中的广泛使用奠定了坚实基础。

SuperCLUE作为独立的第三方测评机构,本次报告聚焦于模型的通用能力,涵盖了理科、文科和Hard三大维度。其中,理科能力包括计算、逻辑推理和代码能力;文科任务则考察知识百科、语言理解、长文本处理、角色扮演、生成与创作、安全性和工具使用等方面;Hard任务主要评估复杂任务的指令执行及高阶推理能力。在这些维度的评估中,腾讯混元不仅在理科和文科领域稳居第一,甚至在最具挑战性的Hard任务中也取得了国内唯一超过70分的优异成绩,仅与ChatGPT-4o存在1.29%的微小差距。

这一成绩的取得,无疑反映了国产大模型的飞速进化。与国外领先模型相比,国内大模型在中文领域的通用能力差距持续缩小,从2023年5月的30.12%缩小至如今的1.29%。这种快速的进步,不仅意味着国内大模型的技术实力大幅提升,更标志着国产大模型在全球范围内的影响力不断扩大。

自2023年9月腾讯混元正式亮相以来,凭借率先在国内采用MoE结构,模型参数规模已扩展至万亿级别,性能稳步提升。除了在通用能力上的突出表现,腾讯混元在文生图、图生文以及视频生成等多模态能力上也取得了显著进展。在此前SuperCLUE-V中文多模态大模型基准榜单中,腾讯混元凭借卓越的多模态理解能力,成功占据国内榜首,稳居卓越领导者象限。

依托强大的模型能力,腾讯混元正加速推动各类应用落地,目前已接入腾讯内部近700个业务及场景,包括腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等多个产品和服务。此外,腾讯旗下协作SaaS产品也全面接入了腾讯混元大模型,进一步拓展了其在企业服务领域的应用深度。

腾讯云已推出多种版本的混元大模型服务,面向企业和个人开发者全面开放。这些版本包括Turbo-Preview、Pro、Standard、Lite等,不仅支持代码生成、角色扮演等专属模型,还可以通过腾讯云TI平台对模型进行精调。基于腾讯多年来在产业互联网领域的深耕积累,腾讯云已联合行业头部企业,为超过20个行业输出了50多个解决方案,帮助企业高效、优质、低成本地创建和部署AI应用。

在国产大模型快速发展的背景下,腾讯混元凭借其强大的技术能力和广泛的应用落地,正不断缩小与全球领先模型的差距,为国产AI技术的发展注入了新的动力。

0 阅读:0

科技小梅爱分享

简介:感谢大家的关注