重磅!OpenAI将发布DALL·E 3,多模态ChatGPT来了!

发布时间:2023-09-21 浏览量:190

9月21日凌晨,OpenAI在官网宣布,在今年10月份将通过API向ChatGPT Plus和企业版用户提供全新文本生成图片产品——DALL·E3。这意味着,ChatGPT在DALL·E3加持下将开启久违的多模态输出模式,用户通过文本就能直接在ChatGPT中生成各种类型图片。例如,在ChatGPT中输入,生成一只可爱的米老鼠、二次元风格、在火星中奔跑、面带惊恐的表情、背着一个火箭背包。如果对生成
豆绘AI(douhuiai.com)09月21日 消息:

9月21日凌晨,OpenAI在官网宣布,在今年10月份将通过API向ChatGPT Plus和企业版用户提供全新文本生成图片产品——DALL·E3。

这意味着,ChatGPT在DALL·E3加持下将开启久违的多模态输出模式,用户通过文本就能直接在ChatGPT中生成各种类型图片。

例如,在ChatGPT中输入,生成一只可爱的米老鼠、二次元风格、在火星中奔跑、面带惊恐的表情、背着一个火箭背包。如果对生成的图片不满意,可以让其反复生成直到满意为止。

早在2021年,OpenAI基于GPT-3大语言模型和变分自编码器(VAE),开发了文本生成图片产品DALL·E,使用方法和功能与Midjourney、百度文心一格等产品类似。

该名字来源于艺术家Salvador Dali和电影《玩具总动员》中的角色WALL·E,也反映了该产品的主要技术特性,生成具有创新性和想象力的图片。

在2022年4月,OpenAI又发布了DALL·E2,在功能、资源消耗方面进行了大幅度优化。

今天宣布的DALL·E3,将比前两代功能更加强大并且可集成在ChatGPT中使用,使其实现多模态输出。

为了增强DALL·E3的数据安全,OpenAI进行了以下优化。

  • 禁止DALL·E3生成暴力、仇恨、成人等非法内容;

  • 禁止生成偏见、歧视、丑化公众人物的图片;

  • 内置内容来源分类器,用于识别DALL·E3生成的图片,防止用于非法用途;

  • 可以选择DALL·E3是否可以提供特定艺术家风格图片:默认是允许;如果艺术家不允许可以申请将其作品,从训练数据中剔除。


声明: 本站所有文章,如无特殊说明或标注,均为网友发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

最新热文 7天