DC娱乐网

百度Create AI开发者大会:解决中国软件卡脖子难题

2022年已经过去,中国科技创新走到什么地步了?1月10日,走到第五年的百度CreateAI开发者大会如期而至,从技术及

2022年已经过去,中国科技创新走到什么地步了?

1月10日,走到第五年的百度CreateAI开发者大会如期而至,从技术及产品进展上,带着外界探询的眼光一窥百度在科技创新上的思考。

当天,百度创始人、董事长兼首席执行官李彦宏发表了题为《创新驱动增长,反馈驱动创新》的演讲,结合昆仑芯片、AI大模型、智慧交通、自动驾驶出行服务等产品,向来自全球的开发者深度阐释如何通过实践反馈驱动有价值的创新。

而在刚刚过去的2022年,全球科技界浪潮迭起,从AI作画走红到ChatGPT风靡全球,从Figma关停中国用户账号到EDA软件被掐,国内科技企业既面临危机,也能看到在人工智能等领域的新机会。

在这样的背景下,百度展现出的众多人工智能新技术落地成果,让众多参会的开发者们感到振奋,在当下全社会奋力拼经济的背景下,为科技产业发展注入更多信心。正如李彦宏在现场所说,“随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年。”

2022年,IT业内两大热点事件席卷了全球:一是AI作画的浪潮猛然兴起,全球范围内的科技企业对AI作画给予了前所未有的关注;二是年末ChatGPT的爆红,让人类进一步认识到人工智能的进化速度。这一切都展现出一个重要趋势:人类正在跑步进入人工智能时代。

这样的技术革命让人想起过去几十年中全球IT产业的发展。就好比PC时代的Windows系统、移动互联网时代的安卓/IOS系统一样,无数开发者基于这两个操作系统开发出众多应用软件,搭建起繁荣的生态体系。那么,人工智能时代的操作系统将会是什么?

在这次的百度Create大会现场,李彦宏给出自己的答案:深度学习框架。他表示,这将“是第四次科技革命的标志”。

深度学习框架对底层语言和重要算法模型进行了封装,让开发者不需要去写大量的重复代码,可以将省却的大量精力投入到应用的研发,这对于人工智能标准化、自动化和模块化的形成意义重大。借用C++编程语言发明者 Bjarne Stroustrup 的话,在人工智能时代,“人类文明运行在深度学习框架之上”。

实际上,在百度内部也早已对深度学习框架的重要性有了一致认知。百度首席技术官王海峰曾表示:“在智能时代,深度学习框架起到了承上启下的作用,下接芯片,上承各种业务模型、行业应用。”

然而,在深度学习框架领域,百度也看到了国内在这一方面的孱弱。过去,主流的深度学习框架大多来自海外企业或团队的研究成果,如Caffe、TensorFlow、PyTorch等,国内也有不少互联网企业、人工智能创业公司使用的深度学习框架就是这些海外产品。

全球化时代,中国互联网以及IT产业的高速发展,曾在很大程度上得益于来自全世界的技术红利,在商业模式、产品形态、开源技术等方面,吸收全球经验加以本土化,推动国内产业发展。一大例证就是,国内手机企业的发展壮大在某种程度上,可以说是建立在高通等企业的芯片、谷歌的安卓操作系统的技术上。

如今,国际科技竞争、产业技术摩擦的日益激烈,让这种脆弱的合作关系岌岌可危。中国手机等行业在芯片领域被卡脖子的遭遇已经证明,把产业建立在不受控制的外部技术根基上,将让海外巨头持续扩大垄断优势,压制国内科技发展“天花板”,导致“无根”之痛。

人工智能时代,深度学习框架作为底层技术创新,承载着无数开发者的关切。这些技术一旦被套上枷锁,国内众多重要行业的智能化转型都将被制约,甚至影响国内第四次科技革命的进程。

在百度看来,人工智能时代,这样的场景不应再重演。李彦宏在大会现场呼吁,“芯片卡脖子很要紧,但软件卡脖子一样要紧。”

解决人工智能时代无“根”之痛的道路在哪里?李彦宏说,“必须要把软件的根扎下去,才能让创新持续发生,才能让顶层的商业更加繁荣。”从实践的层面来说,也就是要掌握深度学习框架的自主研发,才能在人工智能时代扎下根,发出芽,长出参天大树。

百度从2012年就已埋下这颗种子。这一年,百度在国内最早开始投入研究深度学习平台,大规模采购和建立GPU运算集群;2013年成立了深度学习研究院,培养和吸纳大批AI顶尖人才;2016年,推出了中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,百度“飞桨”。

百度飞桨集深度学习训练和预测框架、模型库、工具组件和服务平台为一体,还包括了飞桨企业版零门槛AI开发平台EasyDL和全功能AI开发平台BML,以及飞桨AI Studio学习与实训社区,拥有兼顾灵活性和高性能的开发机制、工业级应用效果的模型、超大规模并行训练、高效推理引擎多端部署以及系统化技术服务支持的五大优势,能够助力开发者快速实现AI想法,创新AI应用。

李彦宏在现场介绍,“飞桨就是人工智能时代的操作系统,让开发者能够像搭积木一样构建AI应用,大大降低AI的应用门槛。”

飞桨的出现,意味着中国打造了自主可控的人工智能操作系统,填补了我国在深度学习基础技术底座方面的空白,也打破了欧美国家对深度学习框架的垄断。

做操作系统的挑战除了技术,更在生态。飞桨源于产业实践,也始终致力于与产业深入融合,构建开放的生态体系。截至2022年11月底,飞桨平台上已凝聚535万开发者、创建67万个AI模型,服务20万家企事业单位。

飞桨的企业生态伙伴,一方面是中小型企业,他们基于飞桨开发大量不同种类的技术服务型应用或者模型,再进一步服务更大的企业应用;另一方面是大企业,大企业本身也会建设行业平台,用到AI中台和飞桨平台。

与大公司相比,飞桨对于小型企业的赋能更能体现中国深度学习框架的易用性和先进性。广州一家信息技术公司曾面临一个考验,为了拿下一个客户,他们需要做一个智能质检一体化方案,这个方案需要算法基础知识的支撑,但团队成员完全没有算法基础。后来,团队基于飞桨 AI 开发平台,仅用 3 天就上手,3 个月将方案做成,并得到了客户的认可。

经过多年发展,如今百度飞桨已是中国市场上唯一可与全球两大主流深度学习框架美国TensorFlow、PyTorch正面交锋的深度学习框架。根据 2021 年 6 月的 IDC 报告,百度飞桨位列中国深度学习平台市场综合份额第一,成为中国使用最广泛的平台。

刘慈欣曾在《三体》中构建了一幅未来场景,三体人通过智子封锁了地球文明的基础科学,将人类科技锁死在低级阶段。而百度飞桨从0开始实现的增长说明,在当前的国际竞争中,科技创新领域的“卡脖子”并非牢不可破,破解之道的核心就在于加快自主创新。

破局的道路就在前面,难的是如何走完这条路。就像李彦宏在现场抛出的问题,“创新本身,它又是从何而来呢?”

“创新不是闭门造车。创新,是你有机会进入市场,不断获得用户和客户的反馈,摸着‘反馈’过河才能实现的。”在现场演讲中,李彦宏将百度的创新心法总结为“反馈驱动创新”。

他举了一个盲人转动魔方的思想实验来说明反馈的力量:把魔方打乱,交给一个盲人还原,假设盲人每秒转动一次,他需要多久才能将魔方复原呢?答案是137亿年。但如果盲人每转动一次魔方,就有人向他做一次反馈,告诉他是更接近目标了,还是更远离目标了,盲人将魔方还原的时间直接被缩短到两分半钟。

“没有外部反馈的时候需要137亿年,能及时获得反馈的时候只需要两分半钟,这就是反馈的神奇力量。”李彦宏强调。

大会现场,李彦宏列举了多项“反馈驱动创新”的成果。

其中之一是百度昆仑芯片。作为中国第一款自研云端全功能 AI 芯片,百度在架构上进行了自研创新,使用了只有英伟达等少数头部芯片企业使用的GDDR6技术,这是目前最新的第六代技术,相比此前主流的GDDR5,GDDR6更加先进,频率更高,显卡性能也有显著提升。现在,百度昆仑芯性能达到国际领先水平,各项性能指标均超越同类产品。

在工业质检领域,部署了昆仑芯产品的智能工厂,算法机能同时处理 24 个模型,处理完所有流程仅需 480 毫秒;深度学习算法能准确识别产品的全部 33 类缺陷,漏检率控制在 0.1% 以内。有一家企业检测产品,过去使用 PyTorch+GPU的方案,成本高且并非国产化方案,后来切换成飞桨+昆仑芯方案,成本降低65%、性能提升9%,更重要的是摆脱了对国外技术的依赖。

昆仑芯成功背后的秘诀,就是在百度的搜索业务中实现了“反馈驱动创新”。

李彦宏介绍,“百度的搜索服务,每天响应几十亿次真实的用户使用需求,每天进行1万亿次深度语义推理与匹配,能够提供最真实、最及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。

正是因为有业务的不断反馈,才会有昆仑芯片的创新,另一个典型案例萝卜快跑同样如此。

萝卜快跑是百度推出的自动驾驶出行服务平台,2022年以来加速在深圳、武汉、阳泉、乌镇等地实现了落地应用。截至 2022年7月,“萝卜快跑”的订单量累计超过100万。其中,2022年Q2,萝卜快跑提供服务28.7万次。2022年Q3,萝卜快跑共提供47.4万次乘车服务,同比增长 311%,环比增长 65%。

加快落地速度的背后,是百度对于萝卜快跑订单量的重视。在百度内部,萝卜快跑的单量是比创造了多少收入更重要的一个指标。

为什么单量很重要?单量背后,是市场需求的真实反映,代表着用户真实的想法。单越多,百度能够获得的反馈就越多,就能够更快地从反馈中寻找到提升自动驾驶技术的关键点。“大量订单量,意味着百度能够获得海量的市场和用户反馈,从而反过来帮助百度不断校正对萝卜快跑的认知。”李彦宏在现场表示。

百度从数据中发现,北京有一个小伙一年打了600多次萝卜快跑,已经超过传统出行方式,成了他的出行首选。在社交平台上,也有很多网友希望无人车出行服务能够开到自己家门口。“这代表着,人们对自动驾驶的接受度很高,自动驾驶的落地速度,可能比预期要快。”李彦宏对萝卜快跑的前景充满希望。

在反馈驱动创新的路径下,百度还以人工智能深入产业,赋能实体经济发展。

2020 年 9 月,百度打造的全球首个高级别自动驾驶示范区落地亦庄,如今,每天有近 100 台自动驾驶车辆在亦庄提供出行服务,ACE 的路口覆盖量在过去一年扩大了近十倍,“聪明的车”和“智慧的路”构建了别具特色的“亦庄样本”,让出行更加安全、便捷、高效、绿色、经济。

2022年8月,交通运输部批准百度开展交通强国建设试点工作。随后,百度在“服务无处不在”的高精地图构建、安全可控的智能汽车技术研发及应用、全息感知的智能道路技术研发及应用、“计算无限可能”的实时云平台研发、智能交通产业生态发展等 5 个方面开展试点。在北京、上海、深圳、长沙、成都等城市落地智能交通及自动驾驶业务。

在百度的AI图谱中,智能交通就像一个“智能调度系统”,可以通过智能红绿灯控制交通流量,从而提升交通效率。通过对交通网络的智能化改造,可以把通行效率提升15%至30%。

李彦宏预测,“智能交通方案可以使得,2027年之前,中国一线城市不再需要限购限行,从而激活汽车消费,为城市疫情之后的经济注入新活力。2032年之前,靠交通效率的提升,拥堵问题就基本可以解决。”

这无疑是一个很宏伟的愿望,其产生的价值不仅仅在于交通领域,还在于这为能源、电力、水务等领域创造了一个行业范式,依靠AI创新应用,能够实现效率的显著提升。“这正是开发者和创造者们的机会。”

沿着这一路径,不难预见,创造者们也将真正迎来属于人工智能的黄金10年。

黄金时代开启的一个重要标志,就是人工智能在技术和商业层面取得的巨大进展。

2022年8月31日,游戏设计师Jason Allen凭借一副使用AI作画软件AI绘图软件MidJourney生成的美术作品《空间歌剧院》,在美国科罗拉多州博览会中获得一等奖。

到11月末,另一项AIGC里程碑级应用ChatGPT面世,ChatGPT的交互界面简洁,只有一个输入框,AI将根据输入内容进行回复,并允许在一个语境下持续聊天。

AIGC在2022年显示出巨大的发展潜力,这背后,是大模型的产业化应用趋势。李彦宏总结,“2022年是大模型产业化应用元年,大模型已成为许多上层应用的技术底座。”

他在现场分享中提到,大模型能够有效继承自然语言处理、计算机视觉、智能语音等多模态能力,并结合多种行业和业务场景进行调优,“从而摆脱传统AI应用碎片化、作坊式开发方式,为深度学习技术进入新阶段带来了机遇。”

百度文心大模型就在这个AI发展的关键节点焕发出新的光彩。

文心大模型是百度自主研发的产业级知识增强大模型体系,全景图由模型层、工具与平台层、产品与社区层构成。

在模型层,文心大模型已经包括 36 个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系,全面满足产业应用需求,构建了业界规模最大的产业大模型体系;在工具与平台层,通过大模型开发套件、文心 API 和提供全流程开箱即用大模型能力的 EasyDL 和 BML 开发平台,全方位降低应用门槛;产品与社区层,包括 AI 艺术与辅助创作平台“文心一格”、产业级搜索系统“文心百中”和旸谷社区,让更多人零距离感受到最先进的 AI 大模型技术带来的新体验。

以文心一格为例,这是百度依托飞桨、文心大模型的技术创新推出的“AI 作画”首款产品。作为业内首个 AI 艺术和创意辅助平台,文心一格可以实现一语成画,只需输入一段自己的创想文字,就可以生成创意精美的画作。文心一格支持国风、油画、水彩、水粉、动漫、写实等十余种不同风格高清画作的生成,还支持不同画幅选择。

目前,文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品,并通过飞桨开源开放平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。

此外,大模型还成为百度自动驾驶能力提升的核心驱动力。百度是行业首个将大模型技术应用于自动驾驶的企业,依托文心大模型特色优势,百度帮助消防车、救护车等特殊车辆增强智能识别能力,即便是塑料袋等物体也能“一眼认出”。

如今,以昆仑芯、飞桨深度学习框架、百度文心大模型为主的核心自研产品构成了百度AI大底座,推动百度AI实力持续攀峰。

发展的背后,是百度一直坚持压强式、马拉松式的研发投入。数据显示,近十年百度累计研发投入超过 1000 亿元。2021 年,百度核心研发费用 221 亿元,占核心收入比例 23%。现在,百度在北京、上海、深圳、新加坡、日本、美国设立了六大研发中心,共有 1 万名研发人员,其中一部分面向前沿研究,也就是百度研究院。

在人才方面,百度已联合了一批业内顶尖的高端人才,并且还在不断培养创新人才。此前,百度推出AICA首席AI架构师培养计划,由深度学习技术及应用国家工程研究中心与百度联合发起,致力于培养高端复合型AI领军人才。经过前六期的发展,AICA已累计培养了322名首席AI架构师深入产业界,成为中国产业智能变革的中坚力量,覆盖能源、工业制造、金融、交通物流、医疗、零售、文娱、企业服务等重点行业,课题项目更加具体和贴近产业一线难题,课题覆盖的场景更广更前沿。

2020年,百度提出未来五年预计培养AI人才500万,为中国智能经济和智能社会的发展提供AI人才保障。据李彦宏现场分享的数据,截至2022年,百度已经培养超过300万AI人才。

高强度投入下,百度AI 专利申请量及授权量连续四年蝉联国内首位、深度学习全球专利申请量全球第一。截至 2022 年 12月,百度全球人工智能专利申请超过 2.2 万件,其中,中国专利申请量超过 1.6 万件,中国授权专利超过 5700件。百度人工智能专利申请量及授权量已连续 5 年蝉联国内首位。

在智慧出行领域,百度研发了在世界范围内、在全行业、第一个能在手机上实现纯软件方案回声消除的技术,实现自由语音交互;通过车路一体的BEV自动驾驶感知方案,为智慧出行装上“千里眼”;跨模态大模型“知一”与新一代索引“千流”两大杀手锏技术,进一步实现用户需求和内容生态的高效连接……

这些成果,让百度解决中国软件“卡脖子”问题的愿景,一步步从设想走进了现实。

李彦宏说:

生机勃勃的新生命已经破冰而出,然而寒冷还没有完全褪去。所有伟大的企业、伟大的创造者也是一样,没有一帆风顺,只有不断地历经困难再凯旋。困难会刺激创新,而创新是增长的真正动力。”