CAPTCHA项目是Completely Automated Public Turing Test to Tell Computers and Humans Apart (全自动区分计算机和人类的图灵测试)的简称,卡内基梅隆大学试图将其注册为商标,但2008年请求被驳回。CAPTCHA的目的是区分计算机和人类的一种程序算法,是一种区分用户是计算机和人的计算程序,这种程序必须能生成并评价人类能很容易通过但计算机却通不过的测试。用于阻止自动垃圾邮件发送者到停止机器人在社交媒体网站上创建欺诈性配置文件的所有内容。在过去的20多年里,它已经发挥作用 - 可能到现在为止。
在中国西北大学、北京大学和英国兰开斯特大学研究人员的共同努力下,计算机科学家开发出了一种能够在短短0.5秒内破解文本CAPTCHA系统的人工智能。它已在不同的33个CAPTCHA计划中成功测试,其中11个来自世界上最受欢迎的网站,包括eBay、微软、谷歌和维基百科。该论文发表于今年的ACM会议上,并是最佳论文奖的入围者。
兰卡斯特大学计算与通信学院副教授Zheng Wang表示:「我们认为我们的研究可能会对CAPTCHA文本进行死刑判决。」
尽管已经提出了几种攻击,基于文本的CAPTCHAs1仍被广泛用作安全机制。其中一个普遍使用文本验证码的原因是很多以前的攻击是针对特定方案的,需要劳动密集型的建设耗时的过程。
但是此次研究人员开发的攻击基于深度神经网络的图像分类器。深度神经网络在图像识别方面表现出令人印象深刻。但是,成功的模型通常需要数百万个手动标记的图像才能学习。这项最新工作的新颖之处在于它使用生成对抗网络(GAN)来创建此训练数据。该系统不需要收集和标记数以百万计的CAPTCHA示例,而只需要500个就可以学习。然后,它可以使用它来生成数百万甚至数十亿的合成训练数据,以创建其成功的图像分类器。结果是比迄今为止所见的任何CAPTCHA识别器系统具有更高的精度。
这种方法对于需要大量训练数据的任何图像识别任务都是有用的。然而,CAPTCHAs在某种程度上是独一无二的,因为它们不断发展。基于文本的早期CAPTCHA是该技术的第一次迭代。但是,到目前为止,您可能更习惯于广泛使用的基于交通标志的CAPTCHA。这种不断变化使收集训练数据变得很痛苦。
「这种方法意味着,当攻击者收集到足够的训练数据时,CAPTCHA 计划将会发生变化,这将使这些努力无效。」Zheng Wang 说,「我们的工作提供了一种以更低的成本生成 CAPTCHA 识别器的新方法。因此,它对 CAPTCHA 计划构成了真正的威胁,因为它可以更快地学习 CAPTCHA 解算器。」
信息来源:https://www.digitaltrends.com/cool-tech/ai-cracks-captcha-05-seconds/