设为首页 收藏本站 English

当前位置: 锦田机械网 >> 最新文章

DeepMind1种结合了对抗训练和线切割强化学习的智能体 SPIRAL

发布时间:2019-07-31 03:31:36

DeepMind:1种结合了对抗训练和线切割强化学习的智能体 SPIRAL

近日,DeepMind 奶茶机发布博客,提出1种结合了对抗训练和强化学习的吊机智能体 SPIRAL。该智能体可与绘图程序互动,在数位画布上画画、改变笔触的大小、用力和色彩,并像街头艺人1样画画。也就是说,通过向 SPIRAL 提供人类用于描绘周围世界的工具,它们也能够生成类似的表征。

人类眼中的世界不只是角箱包革膜映照出的图象。比如,当我们看1幢建筑,赞美其设计精致复杂时,我们能够欣赏到它的精致工艺。通过创造事物异形弹簧的工具来解读事物是帮助我们理解世界的1项重要能力,也是人类智能的重要组成部份。

DeepMind 希望其系统能够按类似的方式构建对世界的发射模块丰富表征。例如,当系统视察1幅画的图象时,它们能够理解画家使用的笔触,而不只是看到屏幕上显现的像素。

在《Synthesizing Programs for Images 幕墙隔断using Reinfo溢流阀rced Adv端子机ersarial Learning》研究中,DeepMind 给PU鞋底人工智能体配备了用于生成图象的工具,并展现了智能体可以推断出数字、字符和画路面机械像被创造出来的进程。关键是,它们学会这么做完全是出于自觉,没有使用人类标注的数据集。这与最近的研究《A Neural Representation of Sketch Drawings》恰恰相反,后者目前仍依赖于从人类演示中学习,是1个时间密集型的进程。

DeepMind 设计了1种深度强化学习智能体,该智能体可与计算机绘图程序(http://mypaint.org/)互动,在数位画布上画画、改变笔触的大小、用力和色彩。最初,这1未经训练的智能体下笔随便,其涂鸦没有明显的内容或结构。为了解决这个问题,DeepMind 不能不提出1种方式来嘉奖智能体,鼓励它生成成心义的涂鸦。

为此,DeepMind 训练出第2个神经网络,叫作辨别器(discriminator),旨在预测特定画活性染料作是智能体生成的,还是来自现套装实照片数据集。绘画智能体所接受的嘉奖决定于它多大程度上能够「欺骗」辨别器,使之认为其画作是真的。换言之,智能体的嘉奖信号是由自己学习而来。这和生成对抗网络使用的涉外家政方法类似,但也有不同,由于 GAN 中的生成器通常是1个可感应炉以直接输出像素的神经网络。而卡包音箱 DeepMind 的智能体通过写图形程序与绘画环境互动,来生成图象。

在第1组实验中,智能体被训练来生成类似 M护角NIST 数字的图象,只对智能体显示数字,而没有数字生成的进程。通过尝试生成欺骗辨别器的图象,智能体学会控制笔触,并绘制合适不同数字的风格,稳压器这类技术叫作三角带视觉程序合成(visual program s井口装置yhthesi开关阀s)。

DeepMind 还训练它来重现特定图象。这里,辨别器要肯定重现出的图象是目标图象的复制,还是由智能体生成的。辨别器判断2者的难度越大,智能体得到的嘉奖就越振动多。

关键是,该框架具有可解释性,由于它能生成1系列控制摹拟画刷的动作。这意味着该模型可以将其学得的东西利用到摹拟绘图程序上,以在其他类似环境中重新创建字符,如在摹拟或真实的机械臂上。

也能够将该框架扩大光纤头到真实数据集上。在浓度计训练智能体绘制名人人脸时,它能够捕捉人脸、色调、发型的主要特点,就像1个寥寥几笔绘制人像的街头画家1样。

从原始感知中找到结构化表征是人类具有且常常使用的能力。该研究显示通过向智能体提供人类用于描绘周围世界的工具,它们也能够生成类似的表征。这样,它们学会生成可简练表达因果关系的视觉程序。

虽然该研究只能代表朝灵空心砖机活程序合成迈进的1小步,但 D人造水晶eepMind 期望类似的技术可以赋予人工智能体类人感知、生成和交换的能力。

友情链接