验证码如何工作,为什么如此困难?

您正在尝试购买商品或登录帐户。您输入凭据,但是在继续之前,您需要证明自己是人类。勾选标有“我不是机器人"的框。您会看到需要破译的带有歪斜数字的模糊图像。这些是验证码,虽然很麻烦,但它们是必需的。

对吗?

什么是验证码,它们如何工作?它们与reCAPTCHA有何不同?为何其中许多这么难?

什么是验证码?

CAPTCHA代表完全自动化的公共Turing测试,以区分计算机和人类。他们以创建图灵测试的天才密码分析家艾伦·图灵的名字命名。这是一种检查机器思维的方法,可以检查机器的行为是否与人类的行为没有区别。

标准的图灵测试包括一个真实的人来判断主题。验证码不是:它们通常由计算机管理。因此,有人将其称为``反向图灵测试'',而另一些人则将其称为``人机交互证明(HIP)''。

CAPTCHA的创建是为了阻止僵尸程序向垃圾邮件网站发送垃圾邮件。任何熟练的技术专家都可以创建一个程序,自动注册多达数百万个帐户。验证码旨在阻止这种情况的发生。

这是因为计算机发现难以解读失真的文本,或者至少比人类更难破解。大多数CAPTCHA在背景中都配以不同的颜色渐变,以进一步模糊信息。

尽管CAPTCHA是由匹兹堡的卡内基·梅隆大学于2003年创造的,但仍由谁来创建CAPTCHA的争论。

这个学术团队认为,它们可以用于保护电子邮件,在线民意调查以及其他需要搜索引擎机器人,蠕虫和垃圾邮件机器人注册以及词典攻击的服务。它们在抵抗分布式拒绝服务(DDoS)攻击方面也很有用。

验证码如何工作?

文本可能确实模糊不清,但是您仍然经常可以分辨出它的含义手段。符号越倾斜,验证码就越有效。那是因为人类表现出pareidolia,这种现象是我们的大脑试图弄乱随机性的一种现象。

-Jamie Sefton(@ Seffers007),2018年11月24日

Pareidolia是您推断不应该出现的面孔的原因。云,建筑物,悬崖峭壁,树木,饮料,鲜花等等。

这种心理怪癖最著名的例子通常是宗教(人们自称在食物中看到了耶稣)和天文学。巴纳德33的口语是马头星云,它会引起口语,您就会知道它。其他人会看到一只兔子刻在月球坑中。

这就是为什么即使在CAPTCHA中,如果它们被划掉并弯曲了形状,也可以辨认出它们的意思。我们的大脑建立了计算机程序通常无法建立的连接。

为什么验证码如此困难?

卡耐基梅隆大学验证码团队的路易斯·冯·安(Luis von Ahn)说,平均需要九秒钟解决验证码。 92%的人做对了。这可能会让您因输入错误的组合而感到愚蠢,但事实并非如此。每个人都是不时剩下的8%的一部分。

实际上,如果验证码区分大小写,故障率将从8%上升到近30%。

问题是推断信息是因为我们可以轻松推断错误信息。 “ I"可以变成“ 1"。当验证码不是由单词而是由随机字母组成时,甚至会变得更加困难。

幸运的是,服务知道人是容易犯错误的,并且不能总是阅读模糊的文本。大多数验证码都提供了生成新验证码的选项,因此,如果您在挣扎中,请对其进行刷新。

—莎拉·杜迪(@sarahdoody)2015年2月22日

主要原因验证码之所以如此艰难,是因为有必要。随着CAPTCHA的发展,攻击者也随之发展。人工智能(AI)甚至可以以大约99%的准确性读取特别失真的文本。验证码必须提高自己的游戏水平。

值得注意的是,谷歌已经大大提高了该技术,但我们会回到这一点。

程序如何击败验证码?使用寻找特定形状的算法来破解它们。这些通常将文本框转换为灰度,从而消除了彩色伪像所带来的失真。然后,他们专注于模式并将其与标准字母和数字进行交叉匹配。

当涉及到任何仍未被识别的数字时,该算法有效地进行了有根据的猜测。

CAPTCHA:可能出错的地方是什么?

CAPTCHA存在许多问题,尤其是对于那些残疾人。

是的,CAPTCHA已经发展为能够更有效地与机器人战斗并为人类带来更多便利。在某些情况下。这样做有几种重要的方式。首先是通过验证变体。一个广泛使用的示例是用照片替换文本。

您可能会看到网格中的图片,并且必须单击显示路标的每个框。之所以如此行之有效,是因为程序受到计算机视觉的困扰,即难以理解数字图像的内容。

某些AI可以区分和理解照片中包含的内容。考虑一下Facebook的DeepFace技术,该技术可以识别面部特征并建议个人资料。尽管如此,这些类型的验证码对于机器人来说是一个额外的挑战,这是暴力攻击及其同类攻击的又一个障碍。

图像对于使用智能手机和平板电脑的用户也很有效:轻按选择右方格。也就是说,只要这些照片能够正确加载!

另一种改编就是音频验证码,它会为那些努力找出数字的人读取文本。这些通常伴随着背景声音。这可能会给使用语音识别软件的垃圾邮件发送者带来更多麻烦。

-Mark Frauenfelder(@Frauenfelder),2019年7月23日

CAPTCHA发展的另一重要方式是与Google集成,并引入了reCAPTCHA。不,它们不是完全一样的东西……

CAPTCHA和reCAPTCHA:有什么区别?

您看到的大多数验证码实际上是reCAPTCHA。后者的功能与前者相同,但是通过进一步的机器学习来超越后者。

此外,reCAPTCHA用于图书的数字化。

它们是由卡内基梅隆大学的同一支团队给我们提供了“ CAPTCHA"一词。开源软件旨在“通过解密计算机不可读的单词来保存文献"。实际上,每次您破译reCAPTCHA中找到的单词时,它都会用于机器学习。您正在帮助程序了解符号的各种形状和样式。

CAPTCHA是随机组合; reCAPTCHA由机器人以前无法分析的目标词组成。

它于2007年发布,并于2009年被Google收购。许多人认为Google是您无法信任的庞大企业集团,但reCAPTCHA做得很多。收购仅两年后,该技术就将Google图书和《纽约时报》的档案完全数字化。两者都是宝贵的信息资源。

具有讽刺意味的是,技术现在可以有效地理解文本,从而使reCAPTCHA变得多余。这就是Google进一步推动这一想法的原因。

人们总是想知道,当您单击“我不是机器人"并立即解密而未解密时会发生什么? Google的新reCAPCTHA分析了您在整个网站上的活动,然后秘密地为您分配概率分数,以确定您是人还是机器人。

本质上,它可以确定您与该服务的交互是否更能说明

对人来说容易,对机器人来说难吗?

随着机器人变得越来越智能,安全系统也必须发展。 ReCAPTCHA是一个足够扎实的想法。现在。

但是许多人质疑Google的权力。人工智能可以识别人类行为。将Google已经知道的关于您的所有信息都考虑在内,这当然值得关注。

标签: CAPTCHA reCAPTCHA