
"我们都说进入了以数据中心为中心的世界,但在这样的人工智能时代,仅有大概2%的数据得到分析,并对生产和生活起到帮助。同时将人工智能从实验室搬到现实生产环境,需要考虑数据的收集、管理、清洗、特征提取、模型训练、推理,数据流的整合分析,以及整个集群的架构、服务等各种管理",这是英特尔人工智能大会(AIDC)深圳站上,英特尔高级首席工程师、大数据技术全球CTO 戴金权对人工智能现状的理解。
英特尔高级首席工程师、大数据技术全球CTO 戴金权
毫无疑问,数据量的爆发为人工智能提供了土壤,云计算、大数据的成熟则为人工智能的开枝散叶输送着养分,由此,人工智能也被誉为第四次工业革命的推动者。借助人工智能,我们即将迎来智慧政务、智慧教育、智慧医疗、智能制造...
但正如戴金权所言,人工智能固然美好,而从理论到大规模落于实地,隔着的,岂止是简单的数据接入、分析、使能,其要求完善的硬件算力平台、便于部署的软件优化方案,更离不开的是,是整个生态系统的培育。
而这些,恰是人工智能时代,英特尔所要提供的。
从端到云的基础硬件平台
人工智能的火热,使其应用场景早已从终端覆盖到边缘侧以及云端,可以说是无处不在。这些场景由于应用的不同,往往对计算的需求也不同。通常而言,终端对计算要求为低延时,云端更关注吞吐量。因此,不同的AI计算需求究竟是通过专用加速卡还是通用CPU来满足成为用户关注点。
英特尔认为,人工智能如同体育运动一样,既需要有专项运动员,又需要有全能型人才,以通过不同的计算解决方案解决不同应用需求。
因此,针对整个计算数据,英特尔将其分为四大类:标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial),并根据四类计算的需求及场景提供不同的CPU、GPU、ASIC、FPGA产品及平台。
如在通用CPU上,面向算力需求苛刻的云端场景,英特尔可提供1路到8路、单路8到56核的50余种标准SKU的第二代至强可扩展处理器;面向功耗控制严格的终端场景,英特尔凌动、酷睿平台实现了性能与TDP的良好平衡。
在专用加速器上,FPGA、ASIC等不同平台亦可满足不同人工智能应用场景。如面向自动驾驶的EyeQ芯片、视觉专用芯片Movidius、深度学习训练芯片NNP-T、深度学习推理芯片NNP-I、方便开发编程的FPGA以及即将问世的独立GPU芯片。
软硬协同的优化方案
在英特尔的AI战略中,"便于落地"是核心追求,也由此,英特尔想提供给客户的AI方案,一定是一种普惠型产品。"人工智能若要从实验室到连续不间断的生产环境,除要考虑精准度外,更离不开部署的便利性及成本"戴金权谈到。
为实现这一目标,英特尔超过15000人的软件工程师团队主要进行了2方面工作:一是从内核层不断引入新的软件技术与底层芯片适配优化,使用户在不增加硬件成本的基础上实现性能的大幅提升,以适用于深度学习、训练推理等人工智能应用;二是从框架优化到平台搭建再到工具套件,提供一套自下而上的整体软件方案,提升整个AI系统的性能并简化开发部署。
具体而言,从至强E系列到至强可扩展再到最新的二代至强可扩展处理器,英特尔所提供的数据中心级处理器除主频、核数的提高外,不断引入AVX-512指令集、DL Boost人工智能加速指令集、DAAL高性能机器学习和数据分析库、MKL-DNN数学核心函数库、nGraph编译器,使得整个硬件平台更适用于人工智能场景。
其中,在第二代至强可扩展处理器中加入的DLBoost指令集VNNI,针对INT8卷积操作进行了优化。通过INT8来取代FP32,实现人工智能训练和推理性能的提升。
另一方面,在软件层面上,英特尔针对TensorFlow、Caffe、MXNet等主流深度学习开源框架持续进行着优化工作,使其通过更好得调用AVX-512指令集释放底层至强可扩展处理器的性能。
同时,英特尔推出了建立在Hadoop/Spark大数据平台之上的原生分布式深度学习库BigDL,通过提供在Apache Spark上的深度学习功能,以帮助 Hadoop/Spark成为一个统一的数据分析平台,为整个数据分析和机器学习过程提供更加统一和集成化的支持。
此外,在BigDL、TensorFLow、Caffe、MXNet框架之上,英特尔又构建了一个大数据分析+AI平台Analytics Zoo,方便用户开发基于大数据、端到端的深度学习应用。而OpenVINO工具套件的推出,使得用户无论是在云端至强可扩展平台,亦或是终端酷睿、凌动等英特尔硬件平台上,均可无缝兼容。
针对这样一个接口实现不同算法的应用,英特尔提出了更进一步的软件策略One API。英特尔希望通过One API这样一个软件平台,一套软件工具,支撑标量计算通用CPU、矢量计算GPU、矩阵运算的ASIC芯片、空间计算的FPGA 4种不同类型加速方案,使得AI应用具备高性能和良好开发效率。
以生态构筑推动AI落地
从端到云的硬件平台,从内核到应用工具的软件优化,在推动AI落地过程中,英特尔已构筑了完整的软硬协作方案。但在英特尔看来,要想让AI真正从实验室走向应用,还缺少一块重要的版图--生态。
于是,继推出人工智能构建者(AI Builders)计划后,英特尔宣布在中国成立大数据分析和人工智能创新院,该创新院整合了英特尔多个部门的技术资源,集中了多位分析专家、人工智能专家和技术工程师,聚焦于三个方面:第一,吸引行业客户、开源社区、学术机构等国内外的伙伴加入进行更广泛的合作,拓宽英特尔的"AI朋友圈",帮助这些伙伴在垂直行业开发、优化和扩展新的AI应用;第二,加速AI在中国市场的落地,让技术普惠给更多的行业客户;第三,帮助用户使用英特尔最新的软硬件产品组合,让中国市场第一时间了解并掌握最先进的技术创新。
同时,英特尔提供了一个面向开发者、学生、教员以及创企的AI学院平台,用户可以在该平台上自由开发、学习、分享。
在今年的AIDC深圳站上,英特尔人工智能构建者计划的两名成员健培科技、赛特斯也分别分享了各自与英特尔合作推动AI落地的成果。健培科技是一家做图像分析的医疗企业,其图像分析机器平台通过迁移至至强金牌6140处理器,并使用英特尔优化的TensorFLow框架,整体数字DICOM图像AI分析性能最高提升8倍,使得该图像读取机器人可帮助医生查找疾病,分析病况及指导手术,目前已应用到临床决策系统中。
赛特斯是一家聚焦于电网和交通领域的科技创新企业,其研发的电网防钓鱼触电隐患监控系统通过选用OpenVINO工具套件,使得在英特尔架构的CPU上,深度学习目标检测算法的计算速度较通用版本深度学习目标检测算法计算速度提升26.1倍,真正使得深度学习在边缘设备上部署应用成为现实。从2019年4月份部署上线,到目前为止一共驱离了280余起的在电线下钓鱼事件,并且所部署该系统的区域到目前为止没有发生过任何一起钓鱼触电事件。
同时,赛特斯基于OpenVINO推出的海事智能船舶统计系统方案,解决了前端智能摄像头检测速度慢及智能算法分布式部署问题,同时减少整体系统硬件设施采购费用,可用于监控与统计客流量、车流量及船舶流量等目标,同时实现违法违规行为的及时报警和隐患防范。
结语
可以看到,在推动人工智能落地的过程中,英特尔提供的,并非单种类的硬件产品或解决方案,而是以多样化底层平台为支撑,通过不同层级软件的优化,构筑一个健康发展的AI生态。正如戴金权所描绘的:"英特尔希望的,是为用户交付最佳的人工智能平台,并通过一系列开源软件的堆栈及生态系统的培育,推动整个行业的发展。"
本文属于原创文章,如若转载,请注明来源:推动人工智能落地 英特尔不只有一种方式//smartcity.zol.com.cn/722/7220926.html