验证码如何工作，为什么如此困难？

您正在尝试购买商品或登录帐户。您输入凭据，但是在继续之前，您需要证明自己是人类。勾选标有“我不是机器人"的框。您会看到需要破译的带有歪斜数字的模糊图像。这些是验证码，虽然很麻烦，但它们是必需的。

对吗？

什么是验证码，它们如何工作？它们与reCAPTCHA有何不同？为何其中许多这么难？

什么是验证码？

CAPTCHA代表完全自动化的公共Turing测试，以区分计算机和人类。他们以创建图灵测试的天才密码分析家艾伦·图灵的名字命名。这是一种检查机器思维的方法，可以检查机器的行为是否与人类的行为没有区别。

标准的图灵测试包括一个真实的人来判断主题。验证码不是：它们通常由计算机管理。因此，有人将其称为``反向图灵测试''，而另一些人则将其称为``人机交互证明（HIP）''。

CAPTCHA的创建是为了阻止僵尸程序向垃圾邮件网站发送垃圾邮件。任何熟练的技术专家都可以创建一个程序，自动注册多达数百万个帐户。验证码旨在阻止这种情况的发生。

这是因为计算机发现难以解读失真的文本，或者至少比人类更难破解。大多数CAPTCHA在背景中都配以不同的颜色渐变，以进一步模糊信息。

尽管CAPTCHA是由匹兹堡的卡内基·梅隆大学于2003年创造的，但仍由谁来创建CAPTCHA的争论。

这个学术团队认为，它们可以用于保护电子邮件，在线民意调查以及其他需要搜索引擎机器人，蠕虫和垃圾邮件机器人注册以及词典攻击的服务。它们在抵抗分布式拒绝服务（DDoS）攻击方面也很有用。

验证码如何工作？

文本可能确实模糊不清，但是您仍然经常可以分辨出它的含义手段。符号越倾斜，验证码就越有效。那是因为人类表现出pareidolia，这种现象是我们的大脑试图弄乱随机性的一种现象。

-Jamie Sefton（@ Seffers007），2018年11月24日

Pareidolia是您推断不应该出现的面孔的原因。云，建筑物，悬崖峭壁，树木，饮料，鲜花等等。

这种心理怪癖最著名的例子通常是宗教（人们自称在食物中看到了耶稣）和天文学。巴纳德33的口语是马头星云，它会引起口语，您就会知道它。其他人会看到一只兔子刻在月球坑中。

这就是为什么即使在CAPTCHA中，如果它们被划掉并弯曲了形状，也可以辨认出它们的意思。我们的大脑建立了计算机程序通常无法建立的连接。

为什么验证码如此困难？

卡耐基梅隆大学验证码团队的路易斯·冯·安（Luis von Ahn）说，平均需要九秒钟解决验证码。 92％的人做对了。这可能会让您因输入错误的组合而感到愚蠢，但事实并非如此。每个人都是不时剩下的8％的一部分。

实际上，如果验证码区分大小写，故障率将从8％上升到近30％。

问题是推断信息是因为我们可以轻松推断错误信息。 “ I"可以变成“ 1"。当验证码不是由单词而是由随机字母组成时，甚至会变得更加困难。

幸运的是，服务知道人是容易犯错误的，并且不能总是阅读模糊的文本。大多数验证码都提供了生成新验证码的选项，因此，如果您在挣扎中，请对其进行刷新。

—莎拉·杜迪（@sarahdoody）2015年2月22日

主要原因验证码之所以如此艰难，是因为有必要。随着CAPTCHA的发展，攻击者也随之发展。人工智能（AI）甚至可以以大约99％的准确性读取特别失真的文本。验证码必须提高自己的游戏水平。

值得注意的是，谷歌已经大大提高了该技术，但我们会回到这一点。

程序如何击败验证码？使用寻找特定形状的算法来破解它们。这些通常将文本框转换为灰度，从而消除了彩色伪像所带来的失真。然后，他们专注于模式并将其与标准字母和数字进行交叉匹配。

当涉及到任何仍未被识别的数字时，该算法有效地进行了有根据的猜测。

CAPTCHA：可能出错的地方是什么？

CAPTCHA存在许多问题，尤其是对于那些残疾人。

是的，CAPTCHA已经发展为能够更有效地与机器人战斗并为人类带来更多便利。在某些情况下。这样做有几种重要的方式。首先是通过验证变体。一个广泛使用的示例是用照片替换文本。

您可能会看到网格中的图片，并且必须单击显示路标的每个框。之所以如此行之有效，是因为程序受到计算机视觉的困扰，即难以理解数字图像的内容。

某些AI可以区分和理解照片中包含的内容。考虑一下Facebook的DeepFace技术，该技术可以识别面部特征并建议个人资料。尽管如此，这些类型的验证码对于机器人来说是一个额外的挑战，这是暴力攻击及其同类攻击的又一个障碍。

图像对于使用智能手机和平板电脑的用户也很有效：轻按选择右方格。也就是说，只要这些照片能够正确加载！

另一种改编就是音频验证码，它会为那些努力找出数字的人读取文本。这些通常伴随着背景声音。这可能会给使用语音识别软件的垃圾邮件发送者带来更多麻烦。

-Mark Frauenfelder（@Frauenfelder），2019年7月23日

CAPTCHA发展的另一重要方式是与Google集成，并引入了reCAPTCHA。不，它们不是完全一样的东西……

CAPTCHA和reCAPTCHA：有什么区别？

您看到的大多数验证码实际上是reCAPTCHA。后者的功能与前者相同，但是通过进一步的机器学习来超越后者。

此外，reCAPTCHA用于图书的数字化。

它们是由卡内基梅隆大学的同一支团队给我们提供了“ CAPTCHA"一词。开源软件旨在“通过解密计算机不可读的单词来保存文献"。实际上，每次您破译reCAPTCHA中找到的单词时，它都会用于机器学习。您正在帮助程序了解符号的各种形状和样式。

CAPTCHA是随机组合； reCAPTCHA由机器人以前无法分析的目标词组成。

它于2007年发布，并于2009年被Google收购。许多人认为Google是您无法信任的庞大企业集团，但reCAPTCHA做得很多。收购仅两年后，该技术就将Google图书和《纽约时报》的档案完全数字化。两者都是宝贵的信息资源。

具有讽刺意味的是，技术现在可以有效地理解文本，从而使reCAPTCHA变得多余。这就是Google进一步推动这一想法的原因。

人们总是想知道，当您单击“我不是机器人"并立即解密而未解密时会发生什么？ Google的新reCAPCTHA分析了您在整个网站上的活动，然后秘密地为您分配概率分数，以确定您是人还是机器人。

本质上，它可以确定您与该服务的交互是否更能说明

对人来说容易，对机器人来说难吗？

随着机器人变得越来越智能，安全系统也必须发展。 ReCAPTCHA是一个足够扎实的想法。现在。

但是许多人质疑Google的权力。人工智能可以识别人类行为。将Google已经知道的关于您的所有信息都考虑在内，这当然值得关注。

验证码如何工作，为什么如此困难？

什么是验证码？

验证码如何工作？

为什么验证码如此困难？

CAPTCHA：可能出错的地方是什么？

CAPTCHA和reCAPTCHA：有什么区别？

对人来说容易，对机器人来说难吗？

用于跟踪加密统计数据的 6 个最佳应用程序

购买新平板电脑前需要检查的 6 大规格

您希望在 2022 年升级到 8K 电视的 3 个原因

Black Mirror 预测的 6 种现实技术

您的下一辆车需要蓝牙的 10 个理由

汽车中的 360 度摄像头如何工作？

Apple 的回收流程是如何运作的？

如何在亚马逊上使用加密支付

DDR5 RAM：它有多快以及它的成本是多少？

埃隆马斯克是《时代》杂志 2021 年的年度人物：原因如下

窗口模式，全屏模式和无边框模式：哪一种最好？

您的下一辆车需要蓝牙的 10 个理由

Black Mirror 预测的 6 种现实技术

使嘈杂的机械键盘静音的 6 种方法

埃隆马斯克是《时代》杂志 2021 年的年度人物：原因如下

什么是加密货币粉丝令牌及其工作原理？

机场X射线扫描仪会损坏您的手机或笔记本电脑吗？

WatchOS 与 Wear OS：哪个最好？