深度学习带来了人工智能的正循环,那这对于我们来说意味着什么?
1、Andrew Ng和深度学习
对于Andrew Ng,大家最熟悉的事件可能是他在谷歌期间借助深度学习让机器通过对数百万份 YouTube 视频的学习自行掌握了“猫”的概念,这成为世界深度学习领域广为人知的成功案例之一,也成为对谷歌人工神经网络“DistBelief”的一次有力验证。
80 年代初期,当时的人工智能研究都在试图寻找捷径,希望可以绕过人脑神经网络来直接模拟出行为,而不是试图通过模仿大脑运作来实现。但有两位技术牛人一直坚持研究模拟神经网络的深度学习,最终他们的算法得到了全球人工智能界和科技公司的关注和重视,他们就是深度学习的领军人物、后来分别被谷歌和Facebook招致麾下的Hinton 和 LeCun。Andrew Ng在大学时期曾经一度放弃了人工智能的研究,直到后来被Jeff Hawkins(Palm创始人,《人工智能的未来》作者)的HTM算法(意思是人类智能来源于这个单一算法)所影响,重新开始了对人工智能的研究,而他的研究方向一直是深度学习。
如今,已经转投百度的Andrew Ng在不久前的百度世界大会上再次强调了深度学习对人工智能的重要意义。从目前看来,深度学习是实现人工智能最有效、也是取得成效最大的实施方法。Andrew Ng在演讲中提到目前百度大脑的新算法就是属于深度学习,他虽然没有具体指明该算法的领先程度,但却强调了其在处理数据方面比传统人工智能算法存在的优越性,并可以使人工智能实现一种正循环。
2、奇点临近——人工智能的正循环
人工智能的正循环是Andrew Ng演讲中的核心要点,在拥有深度学习算法之后,将不再惧怕海量数据,反而会因为数据的增长而取得更好的效果,而这些效果将直接体现在图像搜索、语音识别等具体的互联网服务中,从而为用户提供更好服务并吸引更多用户,这又会产生更多数据。
“人工智能正循环”的确令人兴奋,但人工智能技术发展了几十年,为何恰恰在今天有条件实现正循环?我在文章搜索引擎到人工智能的终极演进提到了搜索引擎到人工智能演进的几个重点条件,包括搜素引擎积累的战略数据、模拟神经网络的机器学习,从Andrew Ng的演讲中已经证实了这两个条件的成熟,他提到“百度有海量数据”以及“百度大脑的新算法”。还有一个重要条件是“技术奇点的出现”,指在积累数据的前提下,硬件存储、超级计算和模拟神经网络等相关技术的成熟。
库兹韦尔在《奇点临近》一书中提到,奇点思想是:人类创造技术的节奏正在加速,技术的力量也正以指数级得速度在增长。指数级的增长是具有迷惑性的,它始于极微小的增长,随后又以不可思议的速度爆炸式地增长。
对于人工智能来说,深度学习的出现就是这样一个奇点。面对海量数据,深度学习算法可以做到传统人工智能算法无法做到的事情,而且输出结果会随着数据处理量的增大而更加准确。
传统机器学习是通过标记数据和有监督学习,这意味着,如果想让机器学会如何识别某一特定对象,就必须人为干预对样本进行标注,也就是说,随着其所需处理数据量的增大,外界对其的支持和帮助也就更大,而且计算结果的准确性也会受到影响。因此,对于这种传统算法,越来越多的数据将成为负担,也更容易达到极限或产生错误结果。但深度学习是从未经标记的数据展开学习,这更接近人脑的学习方式,可以通过训练之后自行掌握概念,这将大幅度提高计算机处理信息的效率。王威廉在《国际机器学习大会ICML2013参会感想》提到:“用半监督或无监督学习方法挖掘无标签的数据,不仅是过去10年,还很可能是大数据时代的一个热点。”拿机器视觉举例,机器学习是通过构建多层类似人类视觉神经系统的算法使机器自行明白物体整体的形态,而传统的人工智能算法往往需要工程师人工输入物体视觉或者声音的信息,然后由机器学习算法来处理这些信息数据。
在加速回归定律的指引下,深度学习将使人工智能的进化节奏加快,并时进化过程中产物(输出结果)获得指数级增长。当深度学习的效率变得更高,就会吸引更多的资源向它聚合,使其发展更为迅速。同时,这些指数级增长都来源于我们对互联网产品的每一次微小的使用以及相应的每次数据的贡献。而这些汇集起来的数据再借助深度学习算法就会为会我们输出更加准确的结果,提供更好的服务,其产生的效果也会像滚雪球一样越来越大。
3、深度学习带来的重要意义
深度学习带来了人工智能的正循环,那这对于我们来说意味着什么?Andrew Ng曾提出,深度学习算法可以使机器“自己学会世界上的一些概念”,也就是机器将具备一定的人类般的学习和思考能力。人类自身的学习能力可以帮助我们自行认识世界,而当机器当过模拟人脑具备了这一能力之后,就可以在一定程度上取代我们部分脑力工作。就像在工业革命和电力革命的影响力,我们自身从体力劳动中解放出来一样,在深度学习所带来的人工智能革命下,我们同样可以将脑力工作外包给机器。
深度学习使机器更加聪明,但我们在这方面应保持足够谨慎,不能过分夸大。我们不需要去考虑“机器智能何时超越人类”等略显科幻的问题,我们仅需要明白这些机器智能将不断下落到具体的互联网应用中,带给我们更加智能的服务。比如说,通过视觉获取和处理图像、通过声音讲出语言是人类最自然的与外界沟通的方式,但传统的计算机服务却无法从本质上读懂我们这些内容,当我们进行图像搜索或者向计算机发送某项指令时,我们需要预先在大脑中做一遍处理,将我们原本要表达的意思转化成计算机能够读懂的文本信息,然后手动输入到计算机并获得结果。但在机器学习的帮助下,我们随意把一张图片丢给电脑就能返回结果,我们直接用语言就可以来命令计算机来为我们提供各种服务。
就像Andrew Ng提到的“(移动)新设备更需要提供更自然的方式找到服务”,而这就是机器学习最实际、最恰当的用途。奇点是未来的一个时期:技术变革的节奏如此迅速,其所带来的影响如此深远,人类的生活将不避免的发生改变。Andrew Ng的深度学习带来了“人工智能”的正循环,给用户带来了更好的互联网服务,这表明或许人工智能的奇点已经到来。而至于要走向何方,Hinton 的一句自述也可以很恰当的用在Andrew Ng 身上——“我们希望把 AI带到一个美妙的新领域,一个还没有人或者程序到达的境界。”
微信公众号:机器之心,微信个人号:zhaoyunfeng1984。