
我们提出了Imagen,一个文本到图像的扩散模型,具有前所未有的写实主义程度和深度的语言理解。Imagen建立在理解文本的大型变压器语言模型的基础上,并依赖于在高保真图像生成中扩散模型的强度。我们的关键发现是,在纯文本语料库上进行预训练的通用大型语言模型(例如T5)在编码用于图像合成的文本方面惊人地有效:在Imagen中增加语言模型的大小比增加图像扩散模型的大小更能提高样本保真度和图像-文本对齐。Imagen在没有经过COCO训练的情况下,在COCO数据集上获得了7.27的最新FID分数,并且人类评分者发现Imagen样本在图像-文本对齐方面与COCO数据本身不相上下。为了更深入地评估文本到图像模型,我们引入了DrawBench,这是一个全面且具有挑战性的文本到图像模型基准测试。使用DrawBench,我们将Imagen与最近的方法进行了比较,包括VQ-GAN+CLIP、潜在扩散模型和DALL-E2,并发现人类评分者在并排比较中更喜欢Imagen,无论是在样本质量还是图像-文本对齐方面。
数据统计
数据评估
关于Imagen【推荐试用】特别声明
本站玉米导航提供的Imagen【推荐试用】都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由玉米导航实际控制,在2024年7月8日 上午11:14收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,玉米导航不承担任何责任。
相关导航

ViewDiff是一个由 Meta 与德国慕尼黑工业大学研发的创新AI模型,旨在帮助用户通过文本、图像或二者结合使用,快速生成高质量多视角3D 图像。ViewDiff解决了传统文本生成多视角 3D ...

Pixela.ai
Pixela.ai允许用户上传稳定扩散算法生成的图像与社区共享。该工具还允许用户找到随机纹理。

90设计
电商设计(淘宝美工)千图免费淘宝素材库

稿定AI-文生图
稿定科技推出的一站式免费AI创意和绘画平台。一张图,一句话,满足灵感绘图,场景生成,素材生成。

AutoDraw
AutoDraw是一个绘图工具,它使用机器学习和天才艺术家的绘画来帮助每个人快速轻松地创建视觉效果。它的特色是一个建议工具,可以猜测数以百计的图纸,可以在任何设备上使用。它是...

starry.ai
starry.ai只需描述您想看到的内容即可生成艺术 ?,我们的人工智能会将您的文字转化为艺术。

AI画一画-9折专享
使用图转视频,一起开启绘画的奇妙之旅

ControlNet
ControlNet是一种通过添加额外条件来控制扩散模型的神经网络结构,是AI图像生成的游戏规则改变者。它为稳定扩散带来了前所未有的控制水平。
暂无评论...