Sider的GPT4o还不行,我已经取消了OpenAI订阅难道要再开

怒喵李楠 2025-03-26 14:49:41

Sider 的 GPT4o 还不行,我已经取消了 Open AI 订阅难道要再开吗。。。

OpenAI 最新发布的 GPT-4o 图像生成功能于2025年3月25日正式推出,这一功能直接集成到 ChatGPT 和 Sora 平台中,标志着 OpenAI 在多模态 AI 领域的又一重大进展。以下是对该功能的新闻总结,以及来自用户和评论界的正反面评价。

新闻总结

根据当天发布的消息,OpenAI 在直播活动中展示了 GPT-4o 的全新图像生成能力。这一功能不再依赖独立的 DALL-E 模型,而是利用 GPT-4o 的原生多模态特性,能够直接通过对话生成和编辑图像。以下是主要特点:

高精度与细节表现

GPT-4o 能够精确渲染文字、遵循复杂指令,并生成细节丰富的图像。例如,它可以绘制带有准确标签的科学图表、多面板漫画,甚至根据用户描述调整颜色(支持 HEX 码)和背景透明度。

上下文记忆与迭代编辑

该模型支持多轮对话,用户可以通过聊天逐步修改图像内容。例如,要求“保持上一张图的人物发型”或“将背景改为动漫风格”,GPT-4o 都能记住上下文并执行。

创新生成方式

与传统扩散模型不同,GPT-4o 采用自回归模式,从图像左上角逐步绘制至右下角。这种方法提高了文字渲染和结构控制的精确度,同时增强了与语言的关联性。

广泛可用性

该功能已向 ChatGPT 的 Plus、Pro、Team 和免费用户开放,并将很快扩展至企业、教育用户及 API 开发者。

安全与道德保障

OpenAI 强调,所有生成的图像都带有 C2PA 元数据以验证 AI 来源,并设有严格的限制,禁止生成涉及真实人物、裸露或有害内容。

OpenAI 首席执行官 Sam Altman 表示,这一功能的推出是 GPT-4o 作为“全能模型”(omni model)的重要一步,旨在让 AI 更实用和易用。

正面评论

技术突破与实用性

许多用户和科技评论家称赞 GPT-4o 的图像生成能力为“革命性”。例如,VentureBeat 报道称其“显著提升了 AI 图像生成的精确度和可访问性”,尤其是在生成多面板漫画和科学图表时表现出色。TechRadar 指出,实时渲染和上下文记忆让图像创作“像与设计师协作一样自然”。

一致性与创意

Beebom 等媒体测试发现,GPT-4o 生成的图像在角色一致性和细节控制上优于之前的 DALL-E 3。用户可以通过对话轻松调整图像,极大增强了创意过程的灵活性。

整合便利性

网友在 X 上表示,直接在 ChatGPT 中生成图像省去了切换工具的麻烦。一位用户写道:“从文字到图像无缝衔接,太牛了,简直是生产力神器!”

反面评论

性能与速度问题

尽管质量提升,部分用户抱怨生成速度较慢。TechCrunch 提到,GPT-4o 在生成图像时“思考时间比 DALL-E 3 长”,可能影响实时应用体验。X 上有用户调侃:“画得是好,但等得我也老了。”

与专业工具的差距

Maginative.com 指出,GPT-4o 的图像生成虽实用,但“短期内难以匹敌 MidJourney 或 Photoshop 等专业工具”。对于需要极高分辨率或复杂编辑的用户来说,它可能只是辅助工具。

版权与数据争议

VentureBeat 等媒体质疑 GPT-4o 的训练数据来源,认为可能包含未经授权的网络艺术作品,这可能引发艺术家群体的不满。X 上有用户表示:“好用是好用,但又是拿谁的作品喂出来的?”

总结

GPT-4o 的图像生成功能无疑展示了 OpenAI 在多模态 AI 上的雄心和技术实力,正面评价集中在其创新性、易用性和一致性上。然而,速度瓶颈、专业性不足以及潜在的版权争议也引发了一些担忧。这一功能的长期影响可能取决于 OpenAI 如何平衡性能优化与道德考量,同时满足不同用户群体的需求。

0 阅读:3
怒喵李楠

怒喵李楠

感谢大家的关注