微软亲自下场研究5000亿参数的超大AI模型MAI-1,挑战GPT4

开心盖土 2024-05-08 05:35:11

在人工智能领域的竞争日趋白热化,科技巨头们正在全力角逐,谁能掌控更强大的大型语言模型就能占据先机。据最新消息,微软准备亲自下场,开发一款全新的大规模AI语言模型MAI-1,其规模可能会挑战OpenAI的顶尖模型GPT-4。

作为微软数十亿美元投资OpenAI的回报,后者的ChatGPT模型一直是微软诸多人工智能产品的“大脑”。但现在,微软打算摆脱对OpenAI的依赖,培养属于自己的“杀手锏”模型。

MAI-1规模惊人 对手是GPT-4

MAI-1的研发由曾担任谷歌DeepMind AI负责人的Mustafa Suleyman(穆斯塔法·苏莱曼)领衔,他刚刚加入微软三个月。据透露,MAI-1的参数量高达惊人的5000亿,比之前微软开源的Phi-3模型大得多,这使它在参数规模上超过Meta的Llama3。

Mustafa Suleyman

GPT-4被曝出具有约1.8万亿参数,虽然参数数量并非衡量AI模型性能的唯一标准,但它反映了模型的复杂性和潜力。

向“大”和“小”两手并举

此次开发MAI-1,标志着微软正在人工智能领域施行“二线作战”。一方面是像Phi-3系列那样面向移动端和本地应用的“小型”模型,追求极致的效率和轻量化;另一方面则投入巨资培养像MAI-1这样的“超级大脑”,代表业界最高水平。

由此可见,曾一度缩手缩脚被谷歌压制的微软,如今已完全走出阴霾,不惜高昂代价也要在AI领域占据高点。此举被外界视为微软渐渐摆脱对OpenAI的依赖,试图在AI领域独立自主发展。

离不开训练数据和算力支持

消息人士透露,微软为了能够胜任训练像MAI-1这样庞大的模型,已拿出大量算力资源,编译了来自GPT-4、互联网以及其他小模型产出的海量语料作为训练素材。这些数据的质量、多样性将直接影响MAI-1的表现。

而在算力方面,微软同样煞费苦心,为MAI-1专门预留了大量Nvidia GPU集群,以满足极高的算力需求。可以说,超级大模型的诞生离不开强大的算力基础设施做支撑。

尚无确定用途 取决实际表现

尽管微软暂未透露MAI-1的具体用途,但如果模型的表现令人满意,它被用于驱动未来一系列微软AI产品和服务的可能性很大。

据悉,如果MAI-1在未来几周取得突破性进展,微软甚至可能在5月底的Build开发者大会上率先展示这一模型的能力。届时,科技爱好者们有望一睹这款“微软亲儿子”级别大模型的风采。

总的来说,微软此次自主研发大型模型,意在增强AI领域的自主能力,不过仍与OpenAI保持技术协作。人工智能浪潮下,科技巨头们正使出浑身解数争夺主导地位,这场马拉松式较量将越来越激烈。

0 阅读:0

开心盖土

简介:感谢大家的关注