可免费使用24个模型进行图像和视频生成的GenAI竞技场

开心盖土 2024-06-01 07:35:33

这里所有文章均来自

微信公众号“火星AIGC”

想要看到更多更新的AI前沿信息、AI资讯和AI工具实操,请关注微信公众号“火星AIGC”。

前面我文章介绍过UC伯克利搞的 LMSYS 大语言模型(LLM)竞技场,可以免费使用33个大语言模型,并进行对比打分,现在已经增加到了47个,包括最新的 GPT4o、Gemini 1.5 Flash 和昨天才出的 Codestral 。

今天介绍的这个是模仿LMSYS,免费使用24个开源 GenAI 模型进行对比的竞技场,里面有8个文生图模型,7个视频生成模型和9个图像编辑模型。其他人看中这个能对生成式AI 模型进行对比,然而我认为这个竞技榜单没多大意义(后面会说到为什么),反而欣喜这是能免费使用这么多图像视频模型的游乐场。

这个 GenAI 竞技场是陈文虎的老虎实验室团队搞起来的,团队成员看名字清一色的华人。陈文虎目前担任加拿大滑铁卢大学计算机科学助理教授,也是谷歌 DeepMind 的兼职高级研究科学家。

GenAI 竞技场里的模型都是开源的,有8个文生图模型,玩AI 绘画的应该对这些模型都非常熟悉。里面有 Stability AI 的最后一个开源文生图模型 StableCascade,字节跳动的SDXLLingting 以及美学评分很高的Playground V2.5。

7个视频生成模型里面也有大家熟悉的 AnimateDiff、StableVideoDiffusion,也有以前我的文章介绍过的 OpenSora。

值得一提的是7个视频生成模型里有6个是国产的,国产模型更是直接霸榜视频生成模型榜单。榜首 AnimateDiff 是香港中文大学、上海AI实验室和斯坦福大学推出的,也是开源视频生成模型中使用最广泛的一个。然后是腾讯AI实验室的 VideoCrafter2 ,上海AI实验室的 LaVie,北京潞晨科技(HPC-AI Tech)的OpenSora,阿里的 ModelScope。

9个图像编辑模型榜单,这些模型我没怎么用过。

文生图榜单排在榜首的是 PlayGround V2.5,字节跳动的 SDXLLightning 排第三,然后是 StableCascade。

PlayGround V2.5 这个模型我在我的电脑上也有部署,放在我的 Stable Diffusion WebUI 和ComfyUI里,其模型以美学评分、人类偏好高评分而著称,在C站上是一个高下载量的模型。

但是我对这个文生图榜单并不以为然。在开源文生图模型中,要说哪个最好,这个就像一千个观众有一千个哈姆雷特一样。我拿我稍稍实测的文生图给大家看看,大家就明白了。

榜单第一和第二就不用比了,同样的模型两个不同版本号实际差别不大。我先用 PlayGround V2.5 跟 SDXLLightning 角斗了两次。

第一次角斗用的提示词“An astronaut sitting on the moon playing video games”,明显右边的 SDXLLightning 胜出。

第二次用十年修得同船度、百年修得共枕眠的英文翻译“After ten years of cultivation, we can cross the boat together, and after a hundred years of cultivation, we can sleep together”。这次明显左边 PlayGround V2.5 胜出。

结果大家应该能看出来,算是打平了。

然后又用 PlayGround V2.5 跟 StableCascade 角斗了三次。

这两次打平,然后用了 Cascade 的强项比了一次。

做为玩文生图的老手都知道,开源模型中 StableCascade 的字母生成是最强的,其他开源模型根本没法比。

简单的实测也能稍稍看出来,开源文生图模型榜单是没什么意义的。为什么我的电脑的SD里有几百G的模型,就是因为各个模型都有自己的优点和长处,这其实也是开源文生图的魅力所在。

差点忘了放链接:

huggingface.co/spaces/TIGER-Lab/GenAI-Arena

最后说一下,图像编辑模型我很少玩就没有测,另外视频生成模型中 AnimateDiff、SVD 我都玩腻了,也没有测。但是 GenAI-Arena 确实是个大宝藏,这也是第一个可以在一个地方免费玩这么多图像视频生成模型的网站,而且速度很快,这背后至少是4090甚至以上级别的显卡,大家赶紧收藏吧。最后感谢赛博菩萨陈文虎老师,666。

0 阅读:10

开心盖土

简介:感谢大家的关注