
我们提出了Imagen,一个文本到图像的扩散模型,具有前所未有的写实主义程度和深度的语言理解。Imagen建立在理解文本的大型变压器语言模型的基础上,并依赖于在高保真图像生成中扩散模型的强度。我们的关键发现是,在纯文本语料库上进行预训练的通用大型语言模型(例如T5)在编码用于图像合成的文本方面惊人地有效:在Imagen中增加语言模型的大小比增加图像扩散模型的大小更能提高样本保真度和图像-文本对齐。Imagen在没有经过COCO训练的情况下,在COCO数据集上获得了7.27的最新FID分数,并且人类评分者发现Imagen样本在图像-文本对齐方面与COCO数据本身不相上下。为了更深入地评估文本到图像模型,我们引入了DrawBench,这是一个全面且具有挑战性的文本到图像模型基准测试。使用DrawBench,我们将Imagen与最近的方法进行了比较,包括VQ-GAN+CLIP、潜在扩散模型和DALL-E2,并发现人类评分者在并排比较中更喜欢Imagen,无论是在样本质量还是图像-文本对齐方面。
数据统计
数据评估
关于Imagen【推荐试用】特别声明
本站玉米导航提供的Imagen【推荐试用】都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由玉米导航实际控制,在2024年7月8日 上午11:14收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,玉米导航不承担任何责任。
相关导航

Meshy是一款基于AI技术的在线3D内容生成工具,主要提供3D建模功能,包括基于图像和文本的模型生成。用户只需输入一张图片或一段文本,AI就能在短时间内创建出3D模型,并且Meshy还...

包图AI文生图
AI自动产图,高质高清,立即下载

Atlas
Atlas是一个利用人工智能技术创建3D内容的平台,它允许用户通过参考图像和文本轻松生成高度详细且多样化的3D模型。

Chaos® Vantage高阶应用
用实时光线追踪探索您的最复杂的3D场景。 使用 Chaos® Vantage,再也无需等待。只需要拖动完整的 V-Ray 场景到 Vantage 便可开始浏览。还可以与 3ds Max,SketchUp,Rhino,Revit ...

通义万相
AI绘画创作大模型,生成符合语义描述的不同风格的图像

Storybird AI
StoryBird是一款新颖的应用,能助你变身故事创作家。仅需你提供20到200个词语,这个应用就能利用这些词语铺陈出一本充满创意的、绘有插图的英文故事书。

Public Prompts
大量且不断增长的免费图像提示。不要购买提示……免费获取。该网站还包括来自各种模型和嵌入的示例。

笔魂AI绘画
笔魂AI绘画-免费在线AI绘画、AI画图、AI设计工具软件
暂无评论...