DC娱乐网

【阿里字节同日发布AI生图新模型】2月10日,中国两大科技巨头阿里巴巴和字节跳动

【阿里字节同日发布AI生图新模型】2月10日,中国两大科技巨头阿里巴巴和字节跳动分别发布了各自最新的AI图像生成模型——字节跳动发布了主打智能理解和高分辨率输出的Seedream 5.0,阿里巴巴则推出了集图像生成与编辑于一体的Qwen-Image-2.0。

这两款模型均在今日正式上线,阿里巴巴通过阿里云百炼平台开放API邀测,用户可通过Qwen Chat免费体验;字节跳动则将Seedream 5.0集成于旗下剪映、CapCut、小云雀等应用,并提供限时免费使用,未来计划在美国市场开放。

阿里巴巴Qwen-Image-2.0的核心创新在于首次将图像生成与编辑功能统一到单一模型架构中。该模型支持长达1000 token的复杂文本输入,能够生成高达2K分辨率的图像,适合专业PPT、海报、多格漫画等复杂场景。

Qwen-Image-2.0尤其在中文文字渲染方面表现卓越,能够准确生成多种字体和复杂文本内容。AI Arena评测数据显示,Qwen-Image-2.0在文本生成图像任务中以1029分位列全球第三,图像编辑能力得分1034,排名第二,接近顶尖水平。

相比之下,字节跳动的Seedream 5.0则强调智能水平的提升,增强了对提示词的理解能力,支持检索生图、多步逻辑推理和联网知识整合,适合复杂知识驱动的任务。

此外,Seedream 5.0支持2K及4K分辨率输出,新增了精准编辑功能。该模型主要对标Nano Banana Pro,突出低成本优势,目前用户可免费使用20次,未来将逐步开放更多地区。尽管在艺术设计感方面略逊于竞争对手,但其在实用性和智能推理方面表现突出。

从技术参数来看,Qwen-Image-2.0的长文本输入能力(1K token)远超行业平均,极大拓展了模型对复杂指令的理解和执行能力。Seedream 5.0则通过多步逻辑推理和联网知识整合,提升了模型对复杂任务的适应性。

在使用体验方面,Qwen-Image-2.0通过阿里云百炼平台和Qwen Chat提供开放体验,用户反馈其生成图像细腻,文字渲染精准,编辑功能灵活多样,能够实现九宫格自拍、多风格转换等多样化创作。

Seedream 5.0则依托字节跳动生态,深度整合剪映、CapCut等视频及内容创作工具,用户可便捷调用模型完成高质量图像生成和精准编辑,尤其适合内容创作者和知识工作者。

两款模型的发布反映了中国AI图像生成领域的多元化发展趋势。阿里巴巴侧重于模型架构的统一与性能提升,字节跳动则聚焦智能理解和知识驱动。阿里巴巴和字节跳动的这两款模型分别代表了不同的技术路线和市场策略,预计将在多个领域展开激烈竞争。

综合来看,Qwen-Image-2.0以其统一架构和卓越的中文文字渲染能力,在专业图像生成与编辑领域具备明显优势;而Seedream 5.0凭借智能推理和高分辨率支持,在知识密集型和高端视觉需求场景中表现突出。各位网友,您怎么看?(钛媒体APP)