深度学习开发框架,是巨头卡位AI关键环节的重要一步棋
任何一个产业,都是由供需两端决定的。要想成为行业霸主,无非就是两条路:最大程度的满足市场需求,或者最大程度的控制市场供给。
对于一般行业而言,比较通用的做法是先关注市场需求,然后以更有效的方式组织市场供给,以此来增强竞争力。无论做什么,市场需求是第一出发点。
这一做法,对于科技行业貌似有点不一样。不是说科技行业的市场需求不重要,而是说科技尤其是软件行业是我们所说的“赋能”工具,市场需求分散在各行各业,不太容易形成规模优势。而供给端就不一样,由于代码低成本复制的特点,其在供给端是很容易形成规模优势的。
这个规律,对于人工智能行业尤其适用。人工智能的应用需求目前还不明确,对于巨头而言,与其苦苦探索需求场景,不如快速占据供给市场。垄断了供给端,无论以后市场怎么发展,自己也有很大概率成为“摘桃子”的人。
人工智能的供给端都有哪些呢,关键环节是什么?人工智能的核心是算法模型,占据了算法模型市场,就占据了供给端的话语权。另一个角度,人工智能的生产人员,是一个个的算法工程师,如果有一个平台,让算法工程师产生依赖,那这个平台就会有很大的生命力。
下图是人工智能体系的架构:
人工智能的核心在于人工智能算法,而软件框架的主要作用就是将AI算法进行封装,为上层应用提供算法调用接口。我们耳熟能详的TensorFlow,MXNet,Caffe/2+PyTorch,主要干的就是算法封装的事。大部分模型的开发、部署,都要用到上面的这些软件框架,需要通过他们调用各种模型,需要用到他们的各种工具组件,需要他们调用底层硬件计算资源。
对于一个市场而言,用户习惯和生态是最难培养的, 但一旦养成了就会是最大的竞争力。AI开发框架平台就是在培养人工智能从业人员的用户习惯,培养应用生态。至于上层的应用场景探索,无论是计算机视觉领域、语音识别领域还是自动驾驶领域,甚至是深入到金融、零售、电商、制造这些行业里的应用,最终都会需要通过这些底层的深度学习开发框架,来调用各种算法,开发各类模型。既然这是一条无法绕开的道路,那就只能等着交过路费了。这就像手机行业的“高通税”,高通垄断了上游,即使不生产手机,也能攫取整个手机行业里很大一部分利润。
而且,人工智能很大程度上可以看作一门以数据为基础的生意。AI开发框架平台,会成为各路数据的一个重要汇聚点,数据汇聚必然伴随着价值汇聚。
这么好的一门生意,当然很多人都想做。但平台的生意,往往门槛都很高。AI开发平台,需要很强的技术实力和资本实力。要得到大家的认可,往往需要在平台处理性能、计算资源调度能力、平台易用性、安全性、生态丰富度这几个方面表现突出才行。
经过这几年的竞争,最终只有几家在这场竞赛中胜出了。在AI开发框架领域,TensorFlow 、 Caffe/Caffe2 占据了相对主导地位,此外主流训练框架还有MXNet,PyTorch,Keras、PaddlePaddle等。
可以看到,目前主流的AI开发框架还是被国外的谷歌、脸书、亚马逊、微软所主导。虽然现在都倡导开源,但鉴于目前中美严峻的政治形势,考虑到未来几十年很可能更加严峻的中美政治形势,保不齐以后人家也在源头上断了你的路。况且,人工智能是美国也很关注的战略产业,不惜一切代价压制中国人工智能行业发展,已经成为美国政治精英的共识,未来他们很可能会采取更加激进的行动。
所以,着力培养国产的AI开发框架,是在非常时期发挥关键作用的“备胎”。中国的互联网巨头以及人工智能独角兽企业,现在已经在有意识地构建底层平台,但差距还是肉眼可见的。如果要取得更大突破,需要在三个方面发力:底层AI理论和技术积累,企业更大的战略决心和资源投入,国内企业的团结协作。