简直就是黑科技!火爆全球的AI绘画你玩过吗

业界
TIME
2022-07-02 10:10
太平洋电脑网
分享

  [PConline 杂谈]AI绝对可以称得上是这几年最火爆的话题。从Alpha Go击败顶尖围棋选手开始,越来越多人意识到在很多领域,AI已经能够用接近人类的思维,更高效地完成任务。在很多领域,AI甚至已经可以涉及甚至部分取代之前只能由人类担任的工作,例如机器翻译有了AI加持后,译文的质量在很多场景下已经达到了可用的程度,电脑和互联网变得越来越聪明了。

▲AI加持的翻译GNMT比之前的PNMT更加接近人工翻译

  然而长久以来,很多人依然认为,在一些体现人类独创性思维的领域,仍是AI的禁区。例如艺术和绘画,很难想象出AI能和人的想象力和手艺一较高下。

  但是,近年AI在图形学的进展,却让人惊呼时代真的变了!不少高质量的AI绘画方案纷纷面世,即使你完全不会画画,凭借着寥寥几笔涂鸦,甚至简单一两句乃至几个词的描述,就能够通过AI生成美轮美奂的绘画,简直如同黑科技,尤其是最近在Google Colab开源的Disco Diffusion,全世界都玩疯了!

▲Disco Diffusion已经可以绘制如此高质量的图画了!

  AI绘画并不是一蹴而几的,它随着算力的增强,以及算法的完善,慢慢修炼到了如今的功力。那么在这几年,都有些什么令人印象深刻的AI绘画方案?今天,就来介绍一些相当值得把玩的AI绘画,来看看AI在如何一步步在艺术领域挑战人类的吧。

Paintschainer

  这可能是最早出圈的AI绘画方案了。Paintschainer在早几年就引起了人们的注意,它并不能完全靠自己来画一幅画,Paintschainer的主要作用是给线稿上色,其效果已经可以追上一些比较简陋的人工上色作品。

  Paintschainer GitHub主页:https://github.com/pfnet/PaintsChainer

  Paintschainer Demo:https://petalica-paint.pixiv.dev/index_zh.html

  Paintschainer在当时之所以突然爆火,是因为人们突然发现,AI居然是可以辨认线稿内容的!Paintschainer的惊人之处,在于它能够识别线稿的内容,例如一张美少女人像,它可以识别某部分属于皮肤,某部分是头发,某部分是衣服,某部分是背景,然后分别涂上适当的颜色。不仅如此,它的上色范围还相当精准,尽管线稿没有封闭,但颜色依然会保留在适当的范围,而不会涂得满地都是——用过PS中油漆桶工具上色的朋友,应该知道这是什么意思。

▲AI可以分辨对于电脑来说很抽象的线稿,并自动上色

▲使用简单的彩色线条作颜色指定ho后,上色更精确,效果甚至已经和人工上色不相上下了

  在很多人的固有认知中,电脑很难“理解”图像,从照片中辨认、总结出内容物是什么。然而Paintschainer却做到了更高的层次,能够“理解”线稿这样比起写实照片更加抽象的图像。尽管Paintschainer并不完美,但它已经足以让人们对于AI的强大有了更加贴切的体验。

NV GauGAN

  NV是显卡界的大拿,无数游戏玩家将老黄视为偶像。而NV同样是AI算力的重要贡献者,它早早在AI领域布局了多枚棋子,到如今NV在AI领域无论是硬件还是配套的软件,都达到了很高的水平——游戏玩家如果用过NV增强画质的DLSS AI算法,一定深有体会。

  DLSS并非是NV在图像AI领域的唯一体现,实际上,NV近年的一个开源AI项目SPADE/GauGAN,就让人啧啧称奇。

  NV SPADE GitHub主页:https://github.com/NVlabs/SPADE

  NV GauGAN 2 Demo:http://gaugan.org/gaugan2/

  GauGAN是一个NV使用AI生成图像的方案,和上文介绍的线稿上色AI相比,GauGAN的强大之处就在于它可以生成完成度极高的图像,而前提是只需要你涂抹几笔,用不同颜色的色块和线条意思一下,GauGAN就可以明白你的意思,还你一张逼真度极高的照片。

  而GauGAN一直处于发展中。今年,GauGAN还推出了第二代,除了依然可以通过简笔画生成照片,现在还能够通过文字描述来生成图像了!

  在GauGAN 2当中,用户只需要输入描述画面的文字,AI就可以自动生成对应的画面。而且,生成的速度非常惊人,几乎就是即时的。例如下图,输入“Ocean”出现海,继而输入“waves”则会出现波浪,继续输入“hitting rocks on the beach”则又继续生成海滩和岩石,效果非常惊人。

  此外,GauGAN还支持用户手动涂抹修改。如果想要对生成的内容做调整,就可以直接用简笔涂鸦,AI会如魔法般变出逼真的对应内容。

  GauGAN之所以有如此大能,是因为使用了对抗网络,大量数据经过机器训练后,使用生成器和鉴别器来识别对应元素,从而匹配数据生成图像。据了解,GauGAN 2使用了1000万张图像进行训练,艺术家使用它不仅可以生成现实的风景,还可以生成天马行空的艺术场景,这超越了很多人以往对电脑插手艺术的固有印象。

Disco Diffusion

  这可能是今年最为人瞩目的绘画AI了!Disco Diffusion一经面世,就刷爆了全球各大社交媒体,它颠覆了很多人对AI的认知。

▲你敢相信,这是AI作出来的画?

  如果说GauGAN的强大之处,在于可以凭借人的简单想象就生成逼真图像,那么Disco Diffusion就更进一步,不仅可以进行复杂的想象,而且还可以生成各种画风的绘画!

  Disco Diffusion是一个运行在Google Colab上的AI,如果要使用它,需要拥有Google账号并且能访问Google,国内的用户可以自行解决这方面的问题。Disco Diffusion的程序是面向公众公开的,在使用之前,我们可以先将其保存到自己的Google Drive网盘,以方便进一步的编辑。

  Disco Diffusion:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

  Disco Diffusion GitHub主页:https://github.com/alembics/disco-diffusion

  Disco Diffusion的强大之处,在于你给出一段描述文字,就能够生成高质量的画作。尽管它没有图形界面,但使用起来并不复杂,进入到“Setting”当中,可以设置名称(AI生成的绘画会保存到Google Drive中对应的文件夹)、尺寸(不要设置太大,保持默认即可)、步数(保持默认即可)等等。

  接着,进入到“Prompts”(提示词)的设置当中,这就是最关键的地方了。在Prompts中,你可以输入描述绘画的词句,例如官方给出的实例为“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme””,意思大致为“奇异灯塔的美丽绘画,在汹涌的血海中闪耀着光芒,参考greg rutkowskiThomas kinkade的画风,以及artstation网站上流行的风格”“黄色主调”。

  然后点击“代码执行程序”中的“全部运行”,静静等待即可。运算过程可能长达几十分钟乃至数小时,运算是在Google的云服务器上运行的,对本机电脑性能没要求。随后,Disco Diffusion就生成了这样一副绘画!

  在很多人眼里,AI能够生成这样的一幅画是非常惊人的,其完成度甚至不属于一些真正的画手。而Disco Diffusion生成这样的一幅画,流程要比手工作画来得更快,而且改一下提示词,又能生成另外不同风格的画了。

▲同样的Prompts提示词,仅仅更换了作者风格的关键字,Disco Diffusion就可以生成不同的画风

  Disco Diffusion对提示词的要求很宽松,完全可以用简单的词语,甚至是机翻来应对。例如笔者填入了“a modern city at night,super wide angle,artstation”这样简单的Prompts,就生成了下面这幅画作。

  Disco Diffusion有很多潜力可发掘。例如使用算力更强的云服务、设置更多次的迭代算法、提供更具体的提示词、甚至给到参考图片,都能够生成更高质量、更多种风格的画作。下面是一些来自互联网的利用Disco Diffusion生成的作品,大家可以感受一下。

▲Prompts:The Vast Viridescent Hillside lacks Rationality and obfuscates its Beauty

▲Prompts:when you have taken everything away, what remains? will you walk this road all the way to the heart of the galaxy?

▲Prompts:forbidden aesthetic

  毫无疑问,Disco Diffusion的出现,颠覆了很多人的三观。这个AI所生成的绘画,甚至已经可以说拥有一定的艺术感了。尽管它对于动物和人物的绘制仍存在短板,而且也并不能胜任人物、场景设计这样具体的、需要扣细节的工作,但无论是给普通人一场视觉盛宴,还是给行业人员找找灵感,都已经绰绰有余了。

  可以说,Disco Diffusion将绘画AI推向了一个新高度,绘画这种讲究审美、讲究灵感的技艺,也不再专属于人类了。

Tiamat

  Disco Diffusion依托在Google Colab上,对于国内用户来说有网络方面的门槛,而且界面说不上易用,还需要用英文来撰写提示词(尽管可以机翻)。现在,对国人更友好的AI绘画方案,正在路上。

  最近,一款名为Tiamat的绘画AI在国内展开了测试。根据内测者微博用户 @春卷 的体验反馈,它的界面比较友好,而且可以用中文来给AI命题,效果还相当不错。

  和Disco Diffusion相比,Tiamat的本土化做得好很多。例如,它甚至能根据诗词来绘画,画面效果相当好,还颇有意境。在微博、小红书平台上,都可以找到很多这样的案例。

▲Prompts:天苍苍,野茫茫,风吹草低见牛羊(来自微博 @春卷)

  ▲Prompts:海压竹枝低复举,风吹山角晦还明(来自小红书 @青柑普洱不甜_Tiamat)

▲Prompts:帘卷落花如雪,烟月,谁在小红亭(来自小红书 @5+1=6)

  可见,Tiamat的AI方案还是有吸引人的独到之处的。不过目前Tiamat目前仍处于内部测试阶段,如果想要亲自体验,可以通过下面的链接来申请测试资格。

  Tiamat内测申请:https://tiamat-ai.feishu.cn/share/base/shrcn2uXL8wNiveykIFYqWSzsPf

  希望Tiamat能够尽快推出公开的版本,让更多国人感受到AI绘画的魅力吧。

总结

  随着硬件性能的进步以及算法的改进,AI仍在飞速发展。AI在绘画方面的建树,已经让人咋舌,大家有条件的话,强烈推荐把玩一下Disco Diffusion,感受AI作画的魅力。未来AI会在更多方面挑战人类的灵智吗?我们拭目以待吧。

THE END
免责声明:本文系转载,版权归原作者所有;刊载之目的为传播更多信息,如内容不适请及时通知我们。

相关热点

  在上半年国内规模最大的电商购物节“618”活动中,科大讯飞C端产品再创佳绩,其AI学习机勇夺双冠,仅6月1日-8日大促期间,C端GMV同比增长67%,讯飞AI学习机同比增长227% ,在...
国内
  新造车势力一窝蜂地涌起,是不是因为真的挣钱呢?近日,第一财经资讯统计了2021年13家车企CEO的薪资,一起来看看大佬们的“工资”吧。  排名第一的自然不是旁人,而是特斯...
产经

相关推荐

1
3