开源模型媲美GPT4o图像生成编辑一体化神器GPT-4o横空出世后，全模态大模型

量子位看科技 2025-05-11 23:27:01

开源模型媲美GPT4o图像生成编辑一体化神器

GPT-4o横空出世后，全模态大模型成为新方向。ModelScope团队顺势推出了开源模型Nexus-Gen，不仅能理解图像、还能生成和编辑，且图像质量直逼GPT-4o。

Nexus-Gen采用Transformer加扩散模型的技术路径，融合MLLM的语言理解能力和扩散模型的图像渲染能力。与传统All-to-All模型不同，它在高维特征空间进行建模，显著提升图像质量。

为了解决图像生成中误差积累的问题，团队提出“预填充自回归”策略，优化训练与推理一致性，从而提升预测准确率。

训练方面，Nexus-Gen统一了三类任务的数据格式，并使用了25M规模的数据，包括图像理解、生成和编辑任务。图像编辑部分尤其依赖ImagePulse数据集，涵盖添加、去除、风格迁移等操作。自回归模块和扩散模块分开训练，分别使用SWIFT和DiffSynth-Studio框架。

模型目前在图像理解、生成和编辑三方面均展示了出色能力，支持多prompt、故事线式编辑等操作，具有广阔的应用潜力。未来团队还计划在模型规模、图像Token数量、融合训练等方向持续优化。

目前包括论文、代码、模型和数据集都已开源——

论文链接：

代码链接：

模型链接：

数据集（ImagePulse）链接：

0 阅读：5

量子位看科技

感谢大家的关注

作者最新文章

1

AI必读Top30论文Ilya精选论文清单OpenAI联合创始人Ilya精选的A

2

吴恩达发文分享招人标准优秀AI应用工程师的必备技能AI大牛吴恩达分享招人标准：优

3

黄仁勋再次驳斥AI末日论Anthropic回应黄仁勋质疑大佬们吵起来了？黄仁勋当

4

DeepMind新模型革新台风预测AI搞定热带气旋路径强度双预测提前15天，就能

5

ChatGPT完败1977年游戏程序ChatGPT承认输给40年前游戏代码Cha

6

芭比娃娃或将内置ChatGPTOpenAI与芭比娃娃合作开发AI玩具Labubu

7

【正在直播】晶上系统生态大会2025晶上系统生态大会2025(SDSoW)暨AI

8

鱼被宰后会经历10多分钟剧烈痛苦科学家将鱼的痛苦量化科学家证明：鱼在被宰后，还会

9

迪士尼环球起诉Midjourney地表最强法务部起诉AI图像生成公司地表最强法务

10

Altman预言2026年AI将颠覆科研AI明年将推动全人类认知发展OpenAI

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

2

同事iphone13pro有几年了，说电池健康度只有70%了，一天到晚的就见他

3

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

4

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

5

你的手机用几年啦？哎，手机坏了，我的华为mate30黑屏两天

6

说好的首发呢？真是没想到，首个通过国家3C认证的骁龙8Elite2机型，既不是

7

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

8

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

9

新机来了三星GalaxyS25FE6.67英寸120hz1080p直屏E

10

大哥这手机，我闭着眼睛都能认出来是啥

科技最新文章

1

说好的首发呢？真是没想到，首个通过国家3C认证的骁龙8Elite2机型，既不是

2

很奇怪，我一直喜欢小屏手机，之前用过的华为Mate50，Mate50Pro，一

3

一天内添置了两台华为手机，一个是给老公买的华为mate70，一台是给婆婆买的华为

4

你的手机用几年啦？哎，手机坏了，我的华为mate30黑屏两天

5

2699元起？华为nova15系列售价曝光，预计10月发布！

6

有点纠结？！如何选也呢？同为12+256G版本的华为Mate70Pro优享版和

7

原来苹果也知道，iPhone128gb不够用啊？看爆料说，iPhone1

8

直屏手机推荐来啦！荣耀Magic7绝对是不错的选择，搭载骁龙8至尊版芯片

9

荣耀power2配置曝光！根据数码闲聊站消息，这个天玑8500搭配100

10

荣耀X70拆机来看8300mAh的青海湖电池直接占了机身60%的空间！主板被压缩