前些年大数据这个词很火,最近一两年AI又火了起来,现在出门不谈点AI 都不好意思跟人Say Hi。

为什么经历了两个冬天的AI在大数据火了之后迎来了新的春天?

仿生学不是出路

AI已经出现几十年了,而最近五年发展十分迅速,为什么?早期研究人工智能的学者认为要让机器获得智能,首先要了解人类是如何产生智能的,然后让计算机按照人的思路去做,要让机器像人一样思考才能获得智能。这种方法论被称为『鸟飞派』,看看鸟是怎么飞的,模仿鸟的动作人就能飞上天。而实际上飞机的发明依靠的是空气动力学而不是仿生学。

数据+统计

后来人类又找到了另一条路子:数据+统计,即采用数据驱动和超级计算的方法。数据最大的作用在于承载信息。在远古时代尼罗河畔的土著居民通过观察天象来准确推测洪水到来和退去的时间,以此来判断一年农耕的时间和节气。但是由于能采集到数据量(例如音频、图像)有限或者计算能力不够无法处理大规模数据导致AI在早些年没有得到快速的发展。

近些年大数据技术得到快速发展,人类可以获得到越来越多的数据。这些数据无论在体量、多维度还是完备性都超过以往。在一些无法确定的因果关系中,数据所包含的信息可以帮助我们消除一些不确定性,甚至数据之间所呈现出的相关性可以取代原来的因果关系,帮助我们得到答案。例如:在图像识别方面,学术上常用的基准测试是一百万幅,所用图像最多的学术论文是1500万幅,而百度用来训练最先进的人脸识别系统所用的数据量为:两亿幅!可见,数据已经开始成为公司的一种资产。

大数据技术带来的另一个红利是对大规模数据的处理能力,近几年对GPU的使用是异构计算发展的一个典型代表,在此技术之上实现了能够利用巨大数据集的机器学习平台。

所以,大数据技术带来的两样东西:大规模数据集和高性能计算,促进了AI的发展。

现在的AI

现在的AI能做什么?除了AlphaGo打败了李世石之外,在语音识别、图像识别、自动驾驶等方面也取得了较好的发展。Andrew Ng 指出AI进展最快的领域是人类能做到的领域,而人类难以做到的事情,目前AI也很难做到。原因有三:

  1. 人类能做的,至少是可行的。
  2. 可以利用人类的经验数据作为培训样本
  3. 人类可以提供指导、校验,进而改善AI

很多领域一旦超过人类自身的能力,AI发展也变得缓慢。由此引发的矛盾:如果AI一直在做人类可以做的事情,实际上是在跟人类进行竞争

未来的AI

在未来人工智能相关的技术和工具会如同水电一样,由专门的公司向全社会提供,各行各业的人们将用这个技术来改变自己所在的行业,就如同利用电力来改变制造业一样,由此将会带动整个人类社会的升级和变迁。