kaile 发表于 9-8-2010 23:58:23

验证码的故事

老网民们大概都记得,刚开始上网的时候,是不存在验证码(capcha)这么一种东西的。这造成的结果是,垃圾评论和垃圾邮件可以轻松通过任何一个网站的注册程序,通过各种方式轰炸人民群众的眼球。
  最先想要解决这一问题的是雅虎——作为互联网时代早期最重要的免费邮件提供商,他们一方面要解决用户们每天遇到的数以百计的垃圾邮件轰炸,另一方面,他们自己的免费邮箱,恰恰又是垃圾邮件的最爱——耗费无数资源所阻止的垃圾邮件,都来自于自己的服务器。这让雅虎开始认真考虑如何解决人机辨识问题。

http://www.admin5.com/upimg/allimg/100809/1107520.jpg
  互联网最早出现的capthca  他们找到一位当时刚刚21岁的天才——Luis von Ahn。 而Luis Von Ahn给出的方案,就是这个让人民群众微微皱眉,但是让计算机耸肩挠头的验证码 Capcha。计算机辨识技术还很落后,对于经过扭曲、污染的文字,无法辨识。而人类却可以轻松认出这些文字。这是一个简单而巧妙的设计,计算机先是产生一个随机的字符串,然后用程序把这个字符串的图像进行随机的污染,扭曲,再显示给显示器前的人或者机器。凡是能够辨识这些字符的,即为人类。
  故事还没完,Luis Von Ahn是那种追求完美的科学家。当全世界数以十亿计的人每天都会浪费几秒钟的时间参与辨认文字这一简单活动的时候,他开始思考,其中浪费的人脑智力是否能得到更好的应用呢?
  Luis Von Ahn的最终设计是,让人们用这些脑力解决一些计算机无法解决的图书数字化。
  在计算机时代以前,印刷术已经存在了数百年,但这些印刷术所产生的书本和报纸等等,对于计算机来说都是模拟信号,仅以图像的形式存在,而非以数字化的形式存在。但是,早期的印刷术并不精确,文字大小不一,形象有差别。而且因为印刷品年代久远,拥有各种细微的缺损和污染。这对人眼来说不是什么大问题,但对计算机来说就麻烦了。
http://www.admin5.com/upimg/allimg/100809/1107521.jpg

http://www.admin5.com/upimg/allimg/100809/1107522.jpg
  目前在google、yahoo、youtube等各个网站都能看到的双capcha,一个是需要辨认的文档图像,一个是计算机生成的capcha
  因此,2002年,luis Von Ahn开始让capcha引用各种无法被计算机辨识的文字图像,目前,已经有上万网站采用他的新一代capcha。每天帮助辨识数以百万计的古老文档。
  问题在于,对于最初的capcha来说,计算机实际上是知道答案的。而Luis希望人们辨识的文字,计算机实际上是不知道答案的,那如何能验证返回的答案到底是不是真的呢?
  解决这个问题的方法依然体现了Luis一贯的简洁和优美,他让人们每次辨识两个,而非一个capcha,其中一个来自于计算机随机生成的字符串,而另一个则是从文档中选取的计算机不认识的字符图像。只要人们对前一个字符串给出的答案是正确的,那么就判定,人们对后一个capcha的辨识是正确的。
  用这一方法,luis的capcha2.0 已经帮助完成了整个纽约时报130年的报纸存档数字化——这一本可能花费无数时间和资源的工程,在几个月之内就由各位网友们完成了。
  当然,这是美国人在capcha中找到的人肉商机。而相对的,知道中国人和印度人怎么从capcha中寻找人肉商机吗?
  简单来说,通过一系列程序转换,亚洲劳动密集型产业把各种垃圾邮件注册、电子游戏金币农民所需要解决的capcha辨认问题,集中给几个专门负责辨认capcha的人手里,这些人的工作就是,替垃圾邮件注册软件辨认capcha,以便他们能冒充人类,每辨认一个获得半个卢比,每天需要辨认成千上万个capcha。
  劳动密集型经济体和资本密集型经济体对人类脑力就是如此区别定价的。

转自: http://www.usidcbbs.com/read-htm-tid-1715.html

dark008 发表于 10-8-2010 00:54:46

NB!!美国佬的创意使这个国家长盛不衰。

另外查了一下,这厮是Carnegie Mellon University毕业的,这学校果然威武。:good

yuba 发表于 10-8-2010 22:19:04

我说最近很多验证码是2个word呢

key 发表于 19-8-2010 02:42:44

CMU... cool! 可惜在可以预见的未来都没有机会和他们再合作做点什么了。

原帖由 dark008 于 9-8-2010 23:54 发表 http://www.freeoz.org/ibbs/images/common/back.gif
NB!!美国佬的创意使这个国家长盛不衰。

另外查了一下,这厮是Carnegie Mellon University毕业的,这学校果然威武。:good

key 发表于 19-8-2010 02:44:11

原帖由 kaile 于 9-8-2010 22:58 发表 http://www.freeoz.org/ibbs/images/common/back.gif
简单来说,通过一系列程序转换,亚洲劳动密集型产业把各种垃圾邮件注册、电子游戏金币农民所需要解决的capcha辨认问题,集中给几个专门负责辨认capcha的人手里,这些人的工作就是,替垃圾邮件注册软件辨认capcha,以便他们能冒充人类,每辨认一个获得半个卢比,每天需要辨认成千上万个capcha。

不知道是否还有人在做这东西,05年的时候,国内的市场价好象是 1 分钱认一个

key 发表于 19-8-2010 02:51:37

这个故事能给人很多灵感。

很多时候,这种连带效应是很有用的。
狭义地理解这个故事,可以是如何建立一种信任模型,
而利用这种信任模型来精化某种非信任结果。

我以前在设计垃圾邮件过滤算法是用过这种想法,可惜由于老板不受接这种改进,最后我也只好放弃了。
目前做的工作是做精确计算,不是智能判别,这种灵感的用处暂时还不大。

coredump 发表于 19-8-2010 09:50:21

so clever!!!

mianwo 发表于 20-8-2010 20:39:11

这点子真不错!
准备在我自己网站上装一个

[ 本帖最后由 mianwo 于 20-8-2010 20:03 编辑 ]

Fernando 发表于 20-8-2010 21:56:32

现在不是有做算术题的验证码么
好像还看到过一个要用积分运算才能做出来的验证码

绿水悠悠 发表于 20-9-2011 21:36:47

现在还要用验证码吗?
页: [1]
查看完整版本: 验证码的故事