google ai输入文本后可生成图像骑呢古怪文本都可变图片 – 十轮网-九游会官网真人游戏第一品牌

google推出全新文本生成图像ai工具“imagen”，并公开一系列由imagen生成的图片。

google旗下深度学习与人工智能科研项目团队google brain，近日发布了一系列由新的文本生成图像ai工具“imagen”制出的成果。imagen通过解析用户所输入的文本而生成写实的图像，更能突破人类的想象力。

在雪地里戴着空手道腰带的火龙果。（a dragon fruit wearing karate belt in the snow.）

机器人在水浸的莫奈美术展览中使用桨板。

（an art gallery displaying monet paintings. the art gallery is flooded. robots are going around the art gallery using paddle boards.）

泰迪熊在奥运400米蝶泳项目中游泳。（teddy bears swimming at the olympics 400m butterfly event.）

图片来源：google

google通过drawbench图像模型基准测试来评估imagen的文本生成图像能力，较vq-gan、ldm及dall-e 2等同类型工具比，imagen生成的图像逼真度更高，语言理解能力也更好，与输入的文本较为符合，偏好率更高达50%。与dall-e 2相比，imagen能准确地为图像配色，而dall-e 2则容易混淆多个颜色指令的文本。

图片来源：google

google表示，由于imagen在生成图像过程的评估工作尚有不足，导致在生成图像时出现一些社会和文化偏见，也倾向西方对性别的刻板印象，例如肤色及对职业的描绘，更出现色情图像、种族主义攻击言论等的不当内容。因此在有关问题修复前，将不会对外开放imagen的程序代码，更不会对外展示。

数据源：deccan herald

发表评论 取消回复

发表评论取消回复