谷歌发布最强文生图大模型 Imagen 2,有哪些技术亮点?虽然很强,但是谷歌它不给用啊。现在只有一小部分被批准的用户才能通过Vertex AI平台用到Imagen 2的文生图...

贴文 2个月前
890 0

谷歌发布最强文生图大模型 Imagen 2,有哪些技术亮点?

虽然很强,但是谷歌它不给用啊。现在只有一小部分被批准的用户才能通过Vertex AI平台用到Imagen 2的文生图功能。

从谷歌放出的演示来看,Imagen 2的能力确实挺强的,尤其是人像的部分,感觉不输Midjourney,比OpenAI的DALL·E 3 强了不知多少倍。(不得不吐槽一句DALL·E的人像确实差劲)

Imagen 2值得特别关注的几个亮点。

1、自定义修改图像中的某个区域。

通过提供参考图像和图像蒙版,用户可以使用被称为inpainting的技术直接在原始图像中生成新内容,或者通过outpainting将原始图像内容进行扩展。

inpaintingoutpainting

2、更灵活的图像风格控制。

简单理解为垫图功能更好用,官方称之为Fluid style conditioning,Imagen 2 基于的Diffusion技术提供了很高的灵活性,可以让控制和调整图像的风格变得更加容易。通过提供参考风格图像和相应的文本prompt,可以使 Imagen 2 生成具有相同风格的新图像。

3、给AI生成的图像打水印——SynthID

这个技术(SynthID)直接就介绍过了,现在被集成到了Imagen 2中。

它是谷歌云和DeepMind发布的用于给AI生成图像打水印的的工具,但是这种“水印”对人类来说是不可见的,而只有使用SynthID工具才能识别和检测到。

SynthID的基本原理是将数字水印直接嵌入图像的像素中,使其无法被人眼察觉,但可以用AI工具检测和识别。它采用的技术不会影响图像质量,并且即使在添加滤镜、更改颜色以及使用各种有损压缩方案(最常用于 JPEG)进行保存等修改之后,水印仍可被检测到。

也就是说以后AI生成的图片可以直接用水印技术检测出来,相当于为AI生成内容的安全性加了一道保障。

暂无评论

暂无评论...