来源 | IEEE Spectrum
作者 | Charles Q. Choi
编译 | Rik R
最近,一项新的研究发现,通过模拟人类视觉的工作原理,人工智能软件可以击败谷歌的 reCAPTCHA 人机鉴别验证码系统,这也是世界上使用最广泛的用于区分人类与电脑的全自动图灵测试。
科学家们补充道,这项发现不仅表明人们需要更强大的自动化人机鉴别技术,也有助于提升计算机在执行机器人任务中的感知能力。
计算机科学之父艾伦·图灵构思了图灵测试,其中最为知名的一个设想为,是否可以设计出一种能够在文本对话中模仿人类的机器,让旁人无法分辨出二者的差异。在进行试验的过程中,图灵促成了人工智能领域的发展。
最常用的图灵测试是 CAPTCHA,即「用来分辨计算机和人类的全自动公共图灵测试(Completely Automated Public Turing test to tell Computers and Humans Apart)」的缩写。CAPTCHA 被用于分辨用户是否为人类,也经常被用于阻止机器人访问计算服务。CAPTCHA 通常会让网站访问者识别一串扭曲的字母和数字,或者是回答一个对计算机来说很难、对人类却很容易的问题。
一般情况下,如果一个算法的识别成功率达到 1%,就可以认为它成功破解了 CAPTCHA。目前,位于旧金山湾区的初创公司 Vicarious 透露,其人工智能软件的 CAPTCHA 识别准确率已经可以达到 66.6%,BotDetect 是 64.4%,雅虎是 57.1%,PayPal 是 57.4%。
Vicarious 开发的系统被称为递归神经网络(Recursive Cortical Network,RCN)。这是一个用来模仿大脑工作方式的人工神经网络。在这种系统中,被称为人工神经元的各个部件会接受外部输入的数据,并相互合作解决诸如识别文本或语音等问题。然后,神经网络可以改变这些神经元之间的连接模式,从而改变它们相互作用的方式,接下来网络又会再次试图解决这个问题。随着时间的推移,神经网络会知道哪种模式最适合用于计算解决方案。(详情可见:学界 | Vicarious 发表 Science 论文:概率生成模型超越神经网络)
此前的神经网络也可以攻破 reCAPTCHA,但需要对数百万张标记过的 CAPTCHA 图像样本进行训练,或者人工标定破解各种图像的方式,而 Vicarious 的系统只需要较少的训练数据。与用最先进的深度学习神经网络来阅读文本相比,Vicarious 递归神经网络能够在使用大约三百分之一的训练数据的情况下,具备与之相当或更高的精度。
「我们的系统已经有能力使用相对较少的样本进行学习,就像人的大脑。」研究负责人 Dileep George 说道,他是 Vicarious 的联合创始人。
Vicarious 称其成功的关键是:在模仿人类大脑的视觉系统之后建模递归神经网络。该公司解释说,递归神经网络的人工神经元是结构化的,因此得以支持模型的生成。这些模型能够快速地识别表面和轮廓,进而能够通过有限的图像和对象样本来辅助识别。
「这些研究结果表明基于文本的 CAPTCHA 已经过时了。」George 说道。他指出,谷歌和其它公司已经从基于文本的 CAPTCHA 转向了新的验证机制,比如依赖于基于图像的 CAPTCHA。
研究人员指出,他们的软件还可以应对与计算机感知相关的其它挑战。「我们正将其应用在许多机器人任务中。」George 说道,「可以想象一下,机器人不仅要识别对象,还要与其进行交互。这就需要建立一个行为反应模型来应对各种情况。」