昇腾大模型资深专家陈仲铭亮相《探迹技术大讲堂》,探讨大模型

彦吉获取 2024-04-30 20:18:55

当今,AI大模型作为一股不可忽视的力量,正引领着全行业的发展。4月24日,探迹技术大讲堂第四期圆满举行。本次大讲堂聚焦于“算法筑基,模力引领”这一主题,旨在深入探讨大模型技术的创新与发展。我们有幸邀请到昇腾大模型资深专家陈仲铭与探迹算法专家Yuiant,两位行业先锋各自从不同角度,为我们带来了一场关于大模型技术的深度解读和未来展望。

大模型下半场的机遇和挑战

Yuiant是探迹算法专家,也是探迹行业大模型创新业务负责人,曾在大模型与行业知识图谱融合上有重大突破。

探迹算法专家Yuiant

课堂上,Yuiant以《大模型下半场的机遇和挑战》为主题,先后阐述了大模型发展进程、背后核心技术以及下半场的机遇和挑战。对于大模型技术“下半场”概念,Yuiant说到,自从ChatGPT掀起AI新浪潮,国内外展开了激烈的“百模大战”,各大厂商也先后完成了MaaS的基建。然而,大模型的行业化落地应用,依然遇到多种挑战,如领域知识覆盖度低、数据非实时、无法与企业内部系统打通等问题。“大模型Agent”亦应运而生。凭借着检索增强生成(RAG),工具识别调用(Function Calling),以及推理规划等新兴技术,大模型Agent弥补了大模型固有的短板,更适合于工业化落地场景。

随着大模型底座与MaaS基建等这些新工业水电煤的完善,Agent将是未来的技术突破焦点,并会成为大模型在TO B场景落地的最主要方式之一。Yuiant认为,大模型下半场的机遇和挑战之一,是要做一个流程可复制、构建低成本甚至应用产业化的行业Agent。在此过程中,探迹的企业知识图谱和行业知识图谱将发挥至关重要的数据优势。未来,探迹亦有望补全目前国内大模型生态建设中最薄弱的“数据”一环。

从AI系统看大模型创新发展

陈仲铭是昇腾大模型资深专家,负责昇腾训练业务整体架构,主导大模型分布式加速库AscendSpeed,拥有113项发明专利,以第一作者发表《深度强化学习原理与实践》等3本专著。

昇腾大模型资深专家陈仲铭

课堂上,陈仲铭以《从AI系统看大模型创新发展》为主题,指出,如今人工智能来到了深度学习、大模型时代,AI芯片成为决定人工智能发展安全、发展高度的重要因素。目前,人工智能芯片行业处于混战阶段,各大巨头如英伟达、谷歌和因特尔在技术、需求理解和市场优势方面各有占据。他强调,在做一款芯片之前,首先要思考和设计AI计算的范式,接着从芯片产业、芯片使能、AI框架等角度,为我们全面分析了从上层到底层的大模型框架与逻辑。

陈仲铭说到,大模型是迄今为止最复杂的软硬件系统工程,每个环节都存在着大量的工程技术挑战,随着AI算力需求的指数级增长,单机算力向集群化演进是大势所趋。同时,他也提到,大模型Agent在未来将成为大模型产业落地的关键引爆点,将为行业发展带来新动力,关于这点两位专家不谋而合。

探迹同学提问

当被问到对“大模型+小数据”技术框架的看法,陈仲铭表示:“我们一直都在密切关注最新算法研究、芯片方向,其中显而易见的趋势是,利用较小的数据量对现有大模型进行微调,使模型更加精准地服务具体应用场景。未来,我相信这条技术路线展现出前所未有的流畅性,没有明显的技术瓶颈。”

本次探迹技术大讲堂,不仅为参与者提供了一个深入了解大模型技术的平台,同时也通过专家的分享引发了大家对AI技术未来格局走向的深思。两位专家关于大模型的深刻见解,尤其是大模型Agent作为技术未来发展的关键点,为我们描绘了一个既饱含机遇又充满挑战的蓝图。在未来,探迹将持续邀请更多领域内的专家分享观点,共同促进思维认知升级与技术交流合作。

0 阅读:1

彦吉获取

简介:感谢大家的关注