不同图像编辑模型直观对比图像编辑实测即梦SOTA图像编辑哪家强?这个网站实测了一

量子位看科技 2025-10-30 12:47:57

不同图像编辑模型直观对比图像编辑实测即梦SOTA

图像编辑哪家强?这个网站实测了一系列案例,最后给出了综合排名【图1】。

性能排名如下:即梦4.0>nano banana>Qwen Image Edit>FLUX.1 Kontext>gpt-image-1>OmniGen2。

即梦4.0综合排名第一,在12个场景任务中,成功了9次。

所有模型成功次数如下:

- Seedream 4:9次成功(总共12个场景)

- Gemini 2.5 Flash:7次成功

- Qwen-Image-Edit:6次成功

- FLUX.1 Kontext(dev版):5次

- OpenAI gpt-image-1:4次

- OmniGen2:1次

图像编辑任务和提示词部分举例:

- 【图1】“给这个秃头男人一头浓密的头发”

- 【图2】“将蓝色方块和黄色方块的位置互换。”

- 【图3】“把鲨鱼改成向上伸出的猫爪。把电影标题从“JAWS”改为“PAWS”。把正在游泳的女人改成一条金鱼。保留原始的美学。”

- 【图4】“在插图的浪里添加一名冲浪者。”

- 【图5】“把一块在特征上与其他石板相似的石板放在那名男子伸出的手中。”

- 【图6】“图像中的塔向右倾斜,请把建筑拉直,使其垂直矗立。”

- 【图7】“把街道和人行道上的所有垃圾清理干净。把躺在地上的睡着的人替换成一个绿色的街道长椅。把停车计时器改成一棵种植的树。”

- 【图8】“把黑桃国王改为红心国王。不要更改黑桃王牌。”

- 【图9】“把房间里的灯打开。保留画作的原始风格。”

重点不是排名,仔细看每张图,不同模型的处理结果,还是很有趣的。

- “交换蓝色和黄色方块位置”这种逻辑推理型task,所有模型失败;

- “撤掉街道垃圾、换掉流浪者和停车杆”这个多目标改写任务,仅3个模型达成;

- “缩短长颈鹿的脖子”或“修改扑克牌上的图案”这类局部精微编辑,只有Seedream表现稳定。

想自己围观效果的可以戳这里:genai-showdown.specr.net/image-editing

0 阅读:0
量子位看科技

量子位看科技

感谢大家的关注