更抽象的情况回到松鼠,尝试生成更抽象的图像,例如 a giant squirrel destroying a city
『一只巨大的松鼠摧毁一座城市』,我们随机采样了一些结果如下,好坏参半:
prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=100,eta=.3,guidance_scale=6)images['sample'][0]

文章插图
prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.3,guidance_scale=6)images['sample'][0]

文章插图
prompt = "a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=100,eta=.3,guidance_scale=2)images['sample'][0]

文章插图
我们似乎观察到 , 目前这个小模型似乎很难融合两个通常相关度没那么高的概念,即『(巨型)松鼠』和『城市』 。我们从一些生成的效果不是特别好的图片可以观察出这一点,下面的结果中 , 要么对城市与天际线做了很好的描述却忽略了松鼠,要么对松鼠和自然环境做了很好的描述,却没有特别强的城市背景:
prompt = "a landscape image showing a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.8,guidance_scale=2)images['sample'][0]

文章插图
prompt = "a landscape image showing a giant squirrel destroying a city"images = ldm([prompt],num_inference_steps=50,eta=.8,guidance_scale=2)images['sample'][0]

文章插图
多次运行这些提示后 , 我们发现当前这个小模型下,总是在主体之间切换但很难将两者融合在一起 。
DALL-E 2的结果我们把同样的内容
"a dramatic shot of a giant squirrel destroying a modern city"
灌给 DALL-E 2 ,让它从提示做图,得到的结果如下:
文章插图
果然在更庞大的AI模型下,生成的结果更自然,也能把不同的细节关联起来 。
总结【Hugging Face发布diffuser模型AI绘画库初尝鲜!】这就是 Hugging Face 新库的初尝鲜!尽管目前开源的小模型上 , 还有一系列的问题,但是这类模型就像一把钥匙,解锁一些令人敬畏的人工智能类人的艺术创造水平 。
短期看,这个小小的预训练模型当然无法取代 DALL-E 2、Imagen 或 Midjourney,但随着开源社区的强大,它会表现越来越好 。
参考资料
- 你给文字描述,AI艺术作画 , 精美无比!附源码,快来试试?。篽ttps://www.showmeai.tech/article-detail/313

文章插图
推荐阅读
- Dapr实现.Net Grpc服务之间的发布和订阅,并采用WebApi类似的事件订阅方式
- 中兴axon30pro发布时间_中兴axon30pro什么时候发布
- 魅族18和一加9对比_魅族18和一加9参数对比
- 从0搭建vue3组件库:自动化发布、管理版本号、生成 changelog、tag
- realme真我v15什么时候发布_realme锦鲤手机发布时间
- macbook pro m1芯片缺点_macbook pro m1芯片续航
- 华为watchgt2pro金卡限定版发布_有什么功能
- 三星s21有充电器吗_三星s21取消充电器吗
- 华为mate50发布时间确定_华为mate50官方首曝
- 真我v15参数_真我v15参数配置详情