这位数学家先后创建 “验证码”和 “多邻国”,20 岁就被盖茨亲自挖去微软!

2020/7/5 13:23:52 来源:大数据文摘微信公众号 作者:千雪、牛婉杨 责编:微尘

Luis Von Ahn 是一位才华横溢的数学教授,我们登录新网站或 APP 时经常用到的验证码 (CAPTCHA),还有一款语言学习软件 “多邻国”(Duolingo),都是他创建的。

就连比尔 · 盖茨都花了 45 分钟才说服当时年仅 20 多岁的危地马拉数学教授 Luis 去微软工作。

显然,Luis 和微软是一个爆炸性的组合,验证码正是 Luis 的创意。而这个创意诞生一周后由雅虎实施,几年后被谷歌收购。Luis 的第二个孩子 “多邻国”(Duolingo)则在推出两年后估值达到 2000 万美元,现今已达到 15 亿美元。

对我们这些普通人来说,只是花几秒时间填写一下验证码(单词类),却不曾想到我们每年竟然能在无形当中完成 230 万本图书的数字化。对我们来说,Duolingo 也是一个学习语言的平台,没想到原来用户在学习过程中就帮助 Duolingo 赚了钱,因为凭借大家的力量,几周内就可以将 CNN 和纽约时报多年以来的全部内容翻译成其他语言,然后向这些新闻机构要翻译费。

看,这些都是 Luis 想出来的。

验证码可不是白填的,用户每年竟在无形当中完成 230 万本书的数字化

有一天,一位雅虎的顶尖研究人员兼人才侦察员来到 Luis Von Ahn 的学校,做了一场题为 “雅虎最难解决的十个问题”的演讲。他们的问题之一,是垃圾邮件发送者会使用自动软件创建数以百万计的假电子邮件地址,然后将广告一堆堆地发送出去。雅虎相当于是本世纪初的谷歌,以技术为导向的年轻 Luis 立刻开始着手解决这项工作。

其实解决方案很简单。Luis 的一位博士同学告诉他,电脑很难看懂手写或者打印出的文本。一个人或多或少能读懂一张模糊图片里潦草的手写笔迹,但软件永远无法与之匹敌。因此,只有非常专注的人,才可以通过验证码的考验。

CAPTCHA

雅虎一周内就实现了这项功能,Luis 完全可以凭此接受一声 “谢谢”。

但 Luis 是一个对自己要求极高的人,他无法接受让人类每天浪费 50 万小时来填写验证码。毕竟每天 50 万小时是一大笔时间,应当好好利用。

很快,一个契机出现了。archive.orgs 和谷歌图书花了大量时间将旧书、文章和文档扫描转换成数字化的电子版本。书籍是由单词组成的,单词又是由字母组成的,验证码也是如此。

简单来说,之前的验证码版本是模糊的数字和字母组合,新版本则是让用户辨别两个单词,这两个词都出自那些已经扫描过的文档或书籍

reCAPTCHA

第一个单词出自公司通过扫描已经确定下来的那部分词汇,它是用来测试用户是否是人类的。而第二个单词是从他们还不确定的那部分词汇里选出,一旦有 10 个用户输入了某个相同的单词,他们就知道这是正确答案。

通过这种方式,reCAPTCHAs 每年可以将 230 万本旧书数字化成可编辑、可搜索的网络文档。后来,谷歌买下了这家公司,这笔收购的钱足以让 Luis 这辈子都不用工作了,而他唯一要做的就是在谷歌待上 3 年。但是他没有。

Duolingo 最初的盈利方式妙不可言:他让用户一边上课,一边为他赚钱

对于一个出生在平均月薪只有 200 美元的国家的人来说,教育是一个令人痛苦的话题。虽然学习平台本来应该为公民提供平等的机会,但往往反而会让贫富差距变得更大。因为学习平台把人分成了两类,一类是有 500 美元可以花在英语课程上的人,另一类是根本没有 500 美元的人。

Luis 说,人们在学习了英语之后,收入往往会翻倍。仅在中国就有 4 亿人学习英语——这几乎是美国和英国人数的总和。除了那些显而易见的工作原因,还有更多潜在的力量在起作用。

互联网上的大部分内容都是英文的,这意味着只有懂英语的人才能接受教育。Youtube 上的耶鲁课程、解说型视频、亚马逊图书、新闻网站、博客——我们可以停下来想想,真正被翻译成我们自己语言的东西是多么的少。比如,世界上有 4.37 亿人说西班牙语,但维基百科中的西班牙语只有英文版的 20% 左右。

所以当 Luis 决定用他的智慧为此做些事情时,他与一个叫 Severin Hacker 的人合作了。他们旨在为世界上大多数人创造一个免费学习语言的途径,为所有可以上网的人提供一个大众化的学习平台。

Luis 已经成为一位经验丰富的企业家,他知道这个免费的应用程序需要有一个赚钱的方式,毕竟他的资金不能永远为新公司提供支撑。这个软件必须从一开始就自给自足。Luis 雇佣了那些熟练使用验证码的技术人员。他一边让用户上课,一边让用户为他赚钱。

在 Duolingo 学习任何一种语言时都不会随机分配单词。有时候,是随机分配一个句子来翻译;还有些时候,句子不是随机的,而是节选自 Duolingo 众多客户的某篇文章——比如 CNN 和纽约时报。

学习外语的同时也在翻译新闻

显然,一个语言学习者绝对不是合格的翻译。为了确保翻译结果是正确的,Duolingo 会用类似验证码的幕后技术来 “点石成金”,将 10 个业余翻译变成一个专业翻译,最终的结果甚至可以和一个训练有素的翻译翻出的结果没有区别。

除了最初的技术成本,Duolingo 可以说是 “免费”的翻译。如果《纽约时报》为每个字的翻译支付 0.10 美元,同时还必须花费人力资源来管理翻译过程,那么 Luis 就能以每字 0.05 美元的价格提供翻译。只要有足够多的用户订阅 Duolingo,它甚至可以在几天内翻译出一年的作品——这将为 Luis 和他的合作伙伴带来 42000 美元的收入。

Duolingo 正在把大学搬到智能手机上

Luis 表示,翻译是一个棘手的行业,世界上总会有一个翻译愿意以半价接手你的工作。此外,Duolingo 本身也开始变得更像一家翻译公司,而不是教育公司。基于这些原因,Duolingo 现在正在走传统的订阅路线。

虽然 Luis 并不喜欢谈论他是如何在市场营销方面发展 Duolingo 的,但是,就像其他伟大的创始人一样,他在独特的核心机制上确实花了很多心思。

课堂上,学生更像是必须认真听课的 “人质”。而 app 却还要与 Instagram 或 Facebook 这些终极对手争夺学生的注意力。为此,Luis 和他的合作伙伴花了 10 年时间来完善每一个弹出窗口、每一个通知、每一种字体和每一种声音,只是为了捕捉用户的专注力。

作者表示,他第一次用 Duolingo 练习中文时,正坐在一家他从来没有去过的咖啡馆,但他一杯咖啡都没有喝。即使有时间可以消磨,他仍然专注于 Duolingo 的学习。

一周后,他发现自己在同样的时间路过了这家咖啡馆。Duolingo 让他开始主动地去学几个新单词。后来他才意识到这正是他第一次用 Duolingo 进行学习的地方。

Duolingo 的决策者们对更加广泛的教育领域也充满了雄心壮志。对于发展中国家的聪明学生来说,雅思或托福这样的认证考试是一个特别痛苦的障碍。不仅学习和考试要花钱,还常常要花好几个小时才能赶到考试场所。为此,Duolingo 正在悄悄地制定他们自己的标准化考试,并被一个又一个的学习机构所接受。

Duolingo 主要宣传的点是:他们比教室更好。虽然我们对这些数字半信半疑,但 Luis 说,一个学生在 Duolingo 上用 32 小时就能学会普通学生在校一个学期的语言。他用 A/B 测试来解释这一现象:老师们经常为了让学生掌握副词而不断练习,Duolingo 则积极测试不同的学习方法,看看哪一种效果最好——比如应该先学习复数还是代词。

但 Luis 关注的不只是语言。对他来说,每一个能够大规模移植到数字世界的学习过程都是值得追求的,而任何方式——包括通过电影字幕学习——都是可行的选择。

相关文章

关键词:微软数学家验证码

软媒旗下网站: IT之家 辣品 - 超值导购,优惠券 IT圈(Win10/WP8.1/Win7论坛) 最会买 - 返利返现优惠券 6655网址之家 Win10之家 Win8之家 Win7之家 Vista之家

软媒旗下软件: 魔方 旗鱼浏览器(极速内核) 云日历 酷点桌面 闪游浏览器(IE内核) Win7优化大师 Win8优化大师 Win10优化大师 软媒手机APP应用