马通常不戴帽子,深层的生成模型或GAN通常不遵循人类程序员制定的规则。但是麻省理工学院开发的一种新工具允许任何人进入GAN并像编码员一样告诉模型将帽子戴在它绘制的马头上。
在本月欧洲计算机视觉会议上出现的一项新研究中,研究人员表明,可以像许多行代码一样对神经网络的深层进行编辑,以生成前所未有的令人惊讶的图像。
该研究的主要作者,博士David Bau说:“ GAN是令人难以置信的艺术家,但是他们仅限于模仿他们看到的数据。” 麻省理工学院的学生。“如果我们可以直接重写GAN的规则,那么唯一的限制就是人类的想象力。”
生成对抗网络(简称GAN)将两个神经网络相互对抗,以创建超逼真的图像和声音。一种神经网络(生成器)学会模仿在照片中看到的脸部或听到的单词。第二个网络,鉴别器,将发生器的输出与原始输出进行比较。然后,生成器迭代地基于鉴别器的反馈,直到其伪造的图像和声音足够令人信服以至于无法通过。
GAN吸引了人工智能研究人员,因为他们具有创造令人惊叹的逼真的图像的能力,有时甚至是深深的怪异,从融化成一堆毛皮的后退猫到站在教堂门口的婚纱,就像新娘抛弃了一样。 。像大多数深度学习模型一样,GAN依靠大量数据集来学习。他们看到的例子越多,他们越能模仿他们。
但是这项新研究表明,大型数据集不是必需的。Bau说,如果您了解了模型的连接方式,即使没有文字示例,也可以编辑其层中的数字权重以获得所需的行为。没有数据集?没问题。只需创建自己的。
他说:“我们的培训数据就像囚徒一样。” “ GAN只学习我们数据中已经存在的模式。但是在这里,我可以操纵模型中的条件来创建带帽子的马。这就像编辑基因序列来创建全新的东西,例如将萤火虫的DNA插入植物中。使它在黑暗中发光。”