图:星环科技孙元浩
2017年AI成为最火热的技术词汇,大量资本涌入这个领域,在中国催生了一批创业公司,在美国催生了大量的收购。这意味着AI到了泡沫的顶峰,并且还将持续一两年。
AI不是一个新的词汇,而是已经发展几十年的技术。从早期的逻辑推理阶段,到专家系统/归纳学习,到机器学习阶段,再到现在的深度学习阶段,每个阶段都产生一些技术突破,也创造过一系列泡沫。例如在2000年左右第一轮互联网泡沫期,希望用AI让机器能够理解互联网,由此催生了semantic web,目标是让机器能够自己理解信息并且机器间能够自由沟通。 随着VR技术的发展,又出现了一批AI驱动的虚拟人/虚拟助理,可以与人自由交谈,当时异常火爆的Second Life是这个阶段的典型代表。在影视作品中,《黑客帝国》把机器智能想象到了极致,人完全沦为机器产生能源的电池,世界全部是由计算机创造和控制的;《人工智能》和《我,机器人》则给机器人赋予了感情,并将引发新的革命。但是过去每一次技术进步,没有带来人们想象中的应用突破,我认为除了算法缺乏突破外,重要原因是受限于计算力和数据。
2006年开始大数据技术得到迅猛发展,从早期的分布式存储和计算系统(HDFS/Map/Reduce 2006-2009),到SQL on Hadoop (2010-2014是焦点阶段)技术的逐渐成熟,已经解决了大规模数据的存储和统计问题,当大数据技术发展到2015年时,业界的关注焦点转向了机器学习,希望利用分布式计算能力,来解决机器学习算法,尤其是神经网络算法的计算能力问题,使之能够完成高密集的迭代计算,从而提高算法精度。记得2015年我去参加纽约的Hadoop World大会,当时就发现短短一年中诞生了近50家机器学习的创业公司,在提供分布式机器学习的产品或服务。计算框架也产生了分歧,Spark当时擅长统计机器学习,而Google当时刚刚开源的单机版Tensorflow则擅长深度学习。同时深度学习算法上的突破,使得过去多个应用领域,包括计算机视觉、自然语言处理、语音交互、传统机器学习、机器人等过去隔得很远的领域,都能被统一成采用一类深度学习算法,都能高效地得到处理,并且能够轻易地超过过去各自领域积累多年的算法。现在开源的人脸识别算法都可以达到98%的精度,使用深度学习算法,可以比较容易地在ImageNet的竞赛中得到前几名。充分说明了深度学习算法已经成熟。
本文网址: