OpenAI救了Stable Diffusion!开源Dall·E3同款解码器 没想到,OpenAI捞了“竞对”Stable Diffusion一把。在热火朝天的“AI春晚”上,OpenAI一口气开源两项工作...

贴文 4周前
490 0

OpenAI救了Stable Diffusion!开源Dall·E3同款解码器

没想到,OpenAI捞了“竞对”Stable Diffusion一把。

在热火朝天的“AI春晚”上,OpenAI一口气开源两项工作,其中之一一致性解码器,专门面向SD的VAE模型。

它能让图像生成质量更高、更稳定,比如多人脸、带文字图像以及线条控制方面。

大V博主分析这个解码器应该是Dall·E 3同款,在GitHub项目页上OpenAI也提供了Dall·E 3论文。

它具体支持的版本是Stable Diffusion 1.4/1.5。

项目页上只放了一个例子,具体怎么训练没有写,被网友称为“人狠话不多式开源”。

你们直接加载使用就好。

而且这个一致性解码器颇有渊源。

它来自OpenAI联创及首席科学家Ilya、OpenAI华人新星宋飏等人提出的一致性模型(Consistency Models)。

上半年这个模型开源时就引发业内震动,被评为能“终结扩散模型”。

就在前不久,宋飏等人还对模型训练方法做了优化,能进一步提升图像生成质量。

开发者日的另一项重磅开源是语音大模型Whisper 3。它同样出自传奇人物之手,一作Alec Radford对GPT系列的构建起到了重要作用。

网友们不禁感慨:还是爱看OpenAI开源啊,期待继续开放更多模型。

一致性模型完成再进化
先来看最初名震江湖的第一版一致性模型(Consistency Models)。

它旨在解决扩散模型通过逐步迭代、导致图像生成缓慢的问题。仅需3.5秒即可生成64张左右256×256的图像。

相比扩散模型,它主要有两大优势: 网页链接

暂无评论

暂无评论...