新一代的智能视觉引擎
当今互联网上,承载人们的生活、工作的主流媒介,已经从传统的文本、图像,逐渐向更为高效的音频和视频的方向发展。音频、视频已成为人们记录生活、分享知识,和传递信息的一种主流方式,并慢慢地影响着整个社会和文化的发展方向。借助于大数据、人工智能、及底层硬件条件的发展,人们开始思考如何从海量的音视频中挖掘有用的信息。
相对于传统的文本和图像,音视频具有信息量更大、复杂度更高,但内容相对冗余等特点。以往集中式的云计算平台由于网络带宽的限制和实时性的要求,存在无法高效地处理海量数据的缺点;而另一方面,随着物联网的兴起,边缘计算平台作为一种新兴的计算平台应运而生。相对于云计算平台,它搭载了先进、高效而又小巧的AI计算芯片。通过部署在边端,它能够高效地获取数据、及时地对处理后的信息进行反馈,并有效地保证了边端数据的安全。大量设备之间也能够通过数据共享和协同工作的方式,满足各行各业对大数据、实时性,以及安全性的要求。
这能否说明未来的视觉平台就是边缘计算平台的天下了呢?个人觉得下这个结论为时尚早。边缘计算平台虽然具有高效、实时、灵活等众多的优点,但却无法统一调控,并且更新换代也不如集中式的云计算平台来得方便快捷。所以,为了适应错综复杂的环境,我们势必需要结合云平台和边端平台的优点来构造边云一体化的智能视觉引擎。
在边云一体化的计算平台架构中,边端平台和云平台各司其职,相辅相成。边缘平台通过部署在边端,能够直接对原始数据进行高效的预处理:一方面产生简单的局部结果对用户进行信息反馈;另一方面整合、压缩原始数据,并将压缩后的数据传回云端进行更为详尽的分析计算,这就有效地避免了由于网络带宽的限制而导致的数据无法实时处理的问题。而云计算平台根据边端传回的数据,对音视频进行二次处理、全局分析,在弥补由于计算资源不够的同时,能够对当前的全局环境进行统筹规划。举个例子,未来的汽车通过在边端部署传感器和处理器来进行避障的同时,能够将当前的道路环境传回云端;而云端则根据大量汽车传回的数据进行统筹分析,进而合理安排所有车队的路径规划,达到有效的分流目的。
目前,国内外的各大公司,包括Amazon、Google、阿里巴巴等云计算的巨头,以及英伟达、高通、华为等硬件产商,都纷纷在边缘计算和AI芯片方向发力。可以预见的是,随着机器学习算法的高速发展和高性能计算资源的普及,边云一体化的计算平台将可能成为未来智能视觉引擎一种主流的趋势。