国内人工智能领域正在技术落地阶段展开新一轮的较量。
对于头部 AI 公司来说,“场景之争”正如火如荼——以视觉识别领域为例,在金融领域,云从科技已经拿下超过80%的国有银行订单;手机市场,商汤与旷视正在瓜分 OPPO、vivo、小米等厂商;而规模最为庞大的安防领域,也出现了商汤、云从、依图三国鼎立,小厂商夹缝求生的景象。
而在越来越多的场景“AI 化”之后,原有的技术架构暴露出的不适应性,则成为倒逼人工智能企业更新底层技术方案的客观力量。
相隔不到一月,9月20日与10月10日,阿里巴巴与华为分别抛下 AI 领域的重磅炸弹,前者宣布启动“达尔文计划”,成立独立芯片公司“平头哥”;后者发布“达芬奇项目”,现场亮出昇腾910和昇腾310两款AI芯片。
纵观两家科技巨头的 AI 方案,不论是“达尔文”还是“达芬奇”,单点式的 AI 技术已不再是呈现重点,取而代之的,是将 AI 与云服务、数据中台、芯片、基站等模块进行结合,生成“全栈 AI”方案,让 AI 以更具象、更低门槛、更产品化的方式进入企业场景。
AI 为何要“全栈”?
不论是华为还是阿里,全栈 AI 的方案提出并不是空穴来风,而是来自市场需求的真实反映。对于所有云计算厂商来说,AI的横空出世其实解答了长期以来的一个问题——“企业为什么要上云?”
对于为数众多的传统企业而言,并不是简单把服务器从自己的机房搬到云服务商的机房就完成了上云,这一转换需要强有力的场景来拉动,而AI所需要的弹性海量的算力,以及带来巨大的颠覆性正好完美契合了这个需求。换句话说,云就是AI最适合的交付方式。
但一个必须承认的事实是,尽管业界讨论 AI 的声量愈加明显,但真正实现 AI 落地的场景依然有限。华为轮值董事长徐直军公布的一份数据显示:只有4% 的企业已经投资或部署了AI;约5% 部署的智慧城市中正在使用AI;2017年只有约10%的智能手机内置了AI。
谈及华为的全栈 AI 战略,华为云总裁郑叶来始终离不开一个词“普惠 AI ”。
“今天的 AI 开发者面临两个难题,一个是慢,一个是贵。”郑叶来说。
慢,指的是 AI 部署慢、训练慢。从升级服务器与数据库,到搭建机器学习平台,输入数据进行学习训练,让机器逐渐掌握人类具备的推理、反应等功能,对于一般企业来说,少则数月,多则数年。
贵,指的是设备贵、人才贵。不论是高通、英伟达的芯片还是 IBM 的小型机,作为训练人工智能的底层基础设施,动辄百万的设备费用成为 AI 方案落地企业的绊脚石;至于人才贵,从华为公布的全球人才占比可见一斑:
可以说,全栈 AI 并不是某个企业空想出的解决方案,而是在 AI “又贵又慢”的发展现状下,被迫从人工智能整条产业链进行重整的改革方式。
如何理解“全栈 AI”?
以华为为例,外界聚焦的两款芯片只是华为 AI 战略中的一环。华为轮值董事长徐直军按照基础研究、全栈 AI、开放生态、AI 思维与内部效率为基准,将华为的 AI 战略分为五大方向,具体结构为:
底层是以芯片为代表的硬件:包含Max、Mini、Lite、Tiny和Nano五个系列的华为昇腾(Ascend)芯片家族,其中,已经推出的昇腾910属于Max系列,昇腾310属于Mini系列。
中层是算法以及机器学习平台:支持云端、边缘、云的统一训练和TensorFlow、PyTorch等主流推理框架MindSpore,以及芯片算子库和高度自动化算子开发工具 CANN。
上层为应用层:由于任正非曾明确表示华为不会涉足应用,此次华为采用了PaaS 的方式,推出 ModelArts 全流程服务,提供分层 API 和预集成方案,以满足不同开发者的需求。
从技术视角来看,所谓“全栈 AI”,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案,而 PaaS、芯片,则成为了用户可以调用华为 AI 能力的方式,这就像是一个装满了 AI 开发工具的百宝箱,用户“开箱”后,就可以很快地上手使用到 AI 能力。
举一个具体的例子,此次华为推出了专门针对视觉开发领域的开发者平台HiLens,当中包含一个带有摄像头的物理小盒子,背后与华为云计算系统连接,开发者只要启动摄像头,就可以在零售、安防等场合迅速上手人脸识别的能力,这就极大降低了原先的部署门槛。
相比眼下 BAT 以及一众 AI 公司在金字塔单个或多个层面做出的努力,华为基于自身云业务与硬件资源的优势,将 AI 从单点式的技术形态,首次完整渗透至公有云、私有云、边缘计算、物联网终端以及消费类终端等部署环境,这类全栈式 AI 的技术落地形式,也将逐步成为 AI 公司完善底层架构时的重要参考标准。
从 AI+云,到全栈 AI
不论是华为、阿里巴巴还是去年号称“All in AI ”的百度,一个有趣的现象是,目前能快速响应全栈 AI方案的厂商,基本都在云计算领域有着多年深耕经验。
对于To B 厂商来说,AI 更像是整套云服务产品中的一个补充模块,这在最先染指云计算业务的亚马逊 AI 方案中有着更为完整地体现。
2006 年亚马逊推出 AWS 云计算服务时,其宗旨就是将原本造价高昂的云端资源与运算能力,用更弹性、经济的方式分配给中小企业;到了2015年,亚马逊开始尝试将这种资源利用的“民主化”转移到AI产品,具体的做法包括将内部一些机器学习的服务打包,相继推出 Amazon Machine Learning(机器学习平台)、Rekognition(图像识别平台)、Polly(语音识别平台)等 AI 应用。
与亚马逊类似,同样是从电商业务延伸至云计算,阿里巴巴的全栈 AI 也发展得顺理成章。
9月下旬的云栖大会,阿里巴巴宣布将今年4月收购的中天微以及旗下的达摩院芯片团队整合,成立“平头哥”,预计明年4月发布一款嵌入式神经网络处理器(NPU)芯片。随着“平头哥”的剥离,阿里巴巴也明确了旗下云计算、AI 芯片、大数据、应用业务之间的关系。
根据阿里巴巴CTO张建锋透露,由阿里云承载的电商平台一天可产生高达 600Pb的数据,达摩院需要解决数据从哪里来以及怎么处理的问题,AI 芯片要为诸如城市大脑、辅助驾驶、自动驾驶等实际场景提供足够的端运算能力,最终降低阿里云的业务成本,由此形成一个正向循环。
百度则是由“云+AI”转向全栈 AI 的另一典型案例。
2016年7月,百度董事长兼CEO李彦宏发布了百度云“人工智能+大数据+云计算”三位一体的发展战略;同年11月,百度总裁张亚勤首次将“云、智、数”三位一体战略总结为ABC(AI,Big Data,Cloud Computing),并表示:“百度 AI 战略将通过百度云落地各行各业。”
“从百度内部来说,To B 的解决方案全部由百度云的团队提供,包括地图、车联网等数据和百度内部的AI 能力,所以我们给客户看到的是一张脸。”百度云副总经理李硕曾在接受钛媒体采访时说。
从2016年至今,百度云的 ABC 战略历经三个阶段的迭代。从 ABC 1.0时期的技术整合,到 ABC 2.0 时期对交通、金融、物流等行业小试牛刀的单点输出,再到今年百度云 ABC 3.0 进一步将百度内部超过110种 AI 能力进行整合,并以ABC-STACK、ABC一体机的形式加速交付,可以说,云业务已经成为了百度对外输出 AI 的窗口。
AI 一体机的兴起
在 2018 年的 AI 技术演化中,诸如 AI 芯片、全栈 AI、边缘计算等技术理念的革新,意味着 AI 已经凭借底层技术端的突破,一步步降低了上层落地应用的门槛。
在这一过程中,还有另一个稍显晦涩的基础设施也焕发出新的生机,它就是用以企业传输数据、提供算力的底层服务器“一体机”。
从2017年开始,一系列人工智能“一体机”应运而生,包括百度、网易、依图、中科睿芯、第四范式等 AI 公司纷纷联手浪潮、ARM、华为等硬件厂商,推出基于人工智能落地方案的一体机。
第四范式创始人戴文渊曾给钛媒体打过一个比方:如果将第四范式此前研发的 AI 平台“先知”比作一套 Windows 系统,用户拿到装载系统的光盘后,还需要在电脑上花力气解决系统兼容、稳定性等问题;而现在的“一体机”就好比是装有 AI 能力的 U 盘,即开即用,这就解决了 AI 落地的最后一公里问题。
9月初,第四范式与浪潮商用机器合作推出 AI 一体机 4Paradigm AIO,成为市面上首个针对超大规模数据挖掘与机器学习计算问题的 AI 一体机产品。
为了适配 AI 落地的技术指标,浪潮将 AI 一体机中诸如数据传输、内存带宽等指标进行调优,同时支持了Chainer、Tensorflow及Caffe等开源人工智能框架,根据第四范式官方透露,相比普通服务器,4Paradigm AIO 整体性能能提升10倍以上。
“传统服务器在设备数量、部署门槛方面,还是给 AI 落地带去很多阻碍,我们也一直在软件层面试图解决这些问题,最后发现硬件是绕不开的环节。”戴文渊对钛媒体说。他预测,未来采用 AI 方案的企业,AI 一体机与传统服务器的比例将会是10:1。
可以看出,这类“AI 平台”+“硬件公司”的软硬一体组合,将极大降低 AI 方案走进企业场景的门槛,谈及两方在 AI 落地阶段的角色分配,浪潮集团AI&HPC总经理刘军将浪潮与百度、网易、第四方式等厂商的合作方案总结为两个方向。
首先,一体机为 AI 平台提供了可供底层支撑的产品载体,这就类似于云业务中的计算设备。“单纯的 AI 芯片厂商无法独立给客户提供价值,特别是当 AI 进入行业后,必须要有服务器硬件系统作为载体才能运行。另外,一体机不是简单地软硬件组合,需要双方配合进行配合、调优、测试、安装等一系列步骤后才能交付给客户。”刘军对钛媒体说。
其次,当 AI 从技术转化为“生意”后,其中涉及的企业级产品经营方法论,并不是百度、网易这类公司具备的,而这恰恰是浪潮这类硬件公司的长处所在。
“在这类 AI 联合化的方案中,包括中期交付、软硬件定制、压力测试、调优、后续服务等环节都是企业级产品需要承载的价值,这个通道不是互联网公司熟悉的生意模式,但在我们做企业传统服务器的时候已经经营很多年了,所以有这个能力可以将AI 的价值赋予到终端。”刘军谈到。(本文首发钛媒体,采访、撰文/苏建勋)