在虚拟仿真世界里,一辆人工智能驱动的无人车在撞击了五万次大树之后才知道这并不是个明智的选择。而在现实世界中,一只幼年野山羊则无需上万次的搏命尝试就可以凭借本能学会如何在陡峭的山坡上爬行。同理,一个三岁女孩找到落脚点而爬上椅子的背后,通常也仅仅是一次突发奇想,而无需上万次的练习。
现如今,基于雄厚的计算资源,强大的人工智能技术正在从零开始学习这个世界的所有。相比之下,人和动物似乎可以通过直觉自然而然地理解某些概念,例如某种物体、某个地点甚至是某些相关的事物,进而快速了解这个世界的运作模式。这就引出了一个关于「先天与后天」的重要问题——人工智能是否需要人和动物与生俱来的认知能力?
近日,在纽约大学举办的活动中,人工智能及心理学领域的两位顶尖研究学者 Yann LeCun 和 Gary Marcus 就这一话题展开了激烈的辩论。
「我们目前所掌握的人工智能技术还不具备描述这个世界的能力,无论是通过网络结还是以学习的方式,都很难接近我们观察到的人和动物所拥有的能力。」纽约大学计算机科学家、Facebook 人工智能研究院院长 Yann LeCun 说道。
LeCun 是人工智能领域深度学习技术的开拓者,这项技术帮助科技巨头实现了许多大众化智能服务,如 Facebook 的人脸识别功能以及 Google Translate 的中英互译等。深度学习算法使人工智能技术可以在缺乏人和动物的先天认知能力的情况下执行这些任务。基于海量数据,深度学习算法不断学习识别这个世界的模式。在拥有 Facebook、Google 以及微软等巨大计算资源的基础上,深度学习算法可以完成图像识别等各种任务。
人们普遍认为,目前人工智能技术的智能水平还不能与人和动物相媲美,即便是深度学习也是如此。不过,LeCun 认为,无监督学习可以让人工智能向这一目标迈进,能够根据未被标记的训练样本解决模式识别中的各种问题。
LeCun 指出,现代人工智能的成功在很大程度上并不依赖于对这个世界的运作原理建立假设和结构化概念。在这个意义上讲,他倾向于最小化人工智能算法的结构以保留这种简单性,而不必利用人类语言学家、心理学家或是认知科学家的知识。「我追求的是尽量减少先天机制的部分,利用我们可以获得的数据去完成学习。」LeCun 说道。
「这不会那么快实现。」纽约大学教授 Gary Marcus 说道。他成立的创业公司 Geometric Intelligence 被 Uber 收购,并被纳入其人工智能研发实验室。他承认,无监督学习有成功的机会。不过他也表示,算法只有具备了「更丰富的元素和表示方式,而不仅仅具有像素」,才能理解这个世界。
「我们希望所构建的这些表示方式和元素可以理解世界中实体以及物理现象,就像孩子们先天拥有的那种能力。」Marcus 说道。
Marcus 希望人工智能领域的研究人员可以「借用认知科学领域的一些知识」,构建更加结构化的算法来表示对象、集合、位置以及时空连续性等认知概念。他引用了自己以及哈佛大学认知心理学家 Elizabeth Spelke 的研究进展,表示儿童在早期就已具备感知人、物体、集合等概念的能力。他的建议是,为什么不在人工智能中使用类似的方法,把一些结构映射到类似的概念上?
Marcu 表示,LeCun 所开发的卷积神经网络能够在物体识别任务中进行高效计算处理就是一个很好的例子,使用更加结构化的方法可以约束人工智能用来理解世界所需的信息量。
「我们真正需要的是系统地思考和分析我们在机器学习中嵌入不同数量的先天机制会发生什么。」Marcus 说道。
对此,LeCun 赞同人工智能需要一定的结构来帮助系统理解世界,但是他想知道生物大脑中是否存在「单一的学习算法、原理或是过程」,还是说否更像是一个无组织无原则无意义的「黑客」集合。在他看来,人工智能受益于单一的学习原则或是这种原则的集合,不管是否内置了先天认知机制的结构,都会出现这种情况。
「现在缺少一个可以让我们的机器通过观察和互动来学习世界运作规律的原则。」LeCun 说道,「我们现在所缺少的是学习预测世界的模型,在我看来,这是人工智能取得突破性进展的最大的阻碍。」
LeCun 表示,智能的本质是预测的能力,因为预测未来可以看成是一种特殊的「填空」场景——在世界状态中填补缺失的空白。常识使人和动物能够根据他们对世界运作原则的知识来填补缺失的信息。这就是为什么人类司机不需要五万次撞树,就能意识到这么做是错误的原因。因为在撞树之前,人类就已经意识到车撞到树后会发生什么事情。
LeCun 希望无监督学习可以使人工智能可以从物理的角度理解世界运作的原理,而不是基于某种粗略的常识。「如果在我职业生涯结束以前,人工智能系统可以像一只猫一样聪明,我会非常开心。」LeCun 补充道,「一只老鼠也行。」
关于人工智能学习到底需要先天还是后天的这个争论还没有定论。但 LeCun 和 Marcus 都认为可以根据关键指标来看谁的想法更为合理。如果无监督学习算法最终需要更多地结构来表达对象、集合、地点等认知概念,那么 Marcus 就是这场辩论的胜者。如果无监督学习算法不需要这样的结构,那么 LeCun 则是正确的。
「关于先天结构的研究,哪怕是前进一小步也可能有很长的路要走。」Marcus 说。
「即便是最小的进展,没错。」LeCun 补充。