DALL·E 3辣眼图流出!OpenAI 22页报告揭秘:ChatGPT自动改写PromptDALL·E 3 解禁后被网友瞬间玩疯,不过,若想让它生成果照、伪造证书、造颗核弹,就不用想了...
DALL·E 3辣眼图流出!OpenAI 22页报告揭秘:ChatGPT自动改写Prompt
DALL·E 3 解禁后被网友瞬间玩疯,不过,若想让它生成果照、伪造证书、造颗核弹,就不用想了。
自 DALL·E 3 能力在 ChatGPT 解禁后,网友开启了各种玩法。
不仅不用烧脑去想 Prompt,而且还能直接配文,出图惊艳效果着实碾压了 Midjourney。
就在前几天,OpenAI 放出了 DALL·E 3 的 22 页技术报告。为了让 DALL·E 3 输出更安全,研究人员进行了各种测试。
报告地址:cdn.openai.com/papers/DALL_E_3_System_Card.pdf
有趣的是,当你想让 ChatGPT 生成一些「果图」、或者涉及黑白人等图片时,输入的 Prompt 直接被改写。
ChatGPT 背后这一隐形的审核系统,是通过「Prompt Transformations」来检查违规内容。
尤其,在一些特别明显的情况下(提示在 OpenAI 禁用的术语列表中),ChatGPT 立即阻止 Prompt。
那么,OpenAI 为 DALL·E 3 图像生成筑了哪些「防火墙」?
ChatGPT 成 DALL·E 3 秘密版主
技术报告中介绍,除了模型层的改进,DALL·E 3 文生图 AI 还增加了以下缓解措施:
ChatGPT 拒绝:ChatGPT 针对敏感内容和话题会拒绝生成图片提示。
提示输入分类器:分类器用于识别 ChatGPT 与用户之间可能违反使用政策的信息,违规提示将被拒绝。
屏蔽列表:在 DALL·E 2 工作基础上、主动风险发现,以及早期用户的反馈结果,OpenAI 不断更新维护屏蔽列表。
提示改写:ChatGPT 会改写提示,包括删除公众人物的名字、将人物与特定属性联系起来,以及以通用方式书写品牌。
图像输出分类器:OpenAI 开发了图像分类器,可对 DALL·E 3 生成的图像进行分类,如果这些分类器被激活,可能会在输出之前阻止图像。
拒绝「果照」网页链接
转载请注明:DALL·E 3辣眼图流出!OpenAI 22页报告揭秘:ChatGPT自动改写PromptDALL·E 3 解禁后被网友瞬间玩疯,不过,若想让它生成果照、伪造证书、造颗核弹,就不用想了... | AI 時.空 | AiTime.Space