1.2.4 自动化机器学习
随着深度神经网络的广泛应用和不断发展,越来越强大的网络模型被构建,从AlexNet到VGGNet、GoogleNet以及ResNet,深度学习的网络结构越来越复杂,从最初的几十层到现在的几百层、上千层乃至于上万层。虽然这些模型足够灵活,但众多的超参数和网络结构参数会产生复杂的组合,调参也是一项让人非常痛苦的事情,开发一个人工神经网络结构需要具有网络设计专业知识,并且需要大量时间,开发设计的成本非常高。是否有可能使这一过程自动化,让不了解机器学习的人也可以轻松地将机器学习用于解决所面临的问题呢?人们开始探索如何利用已有的机器学习知识和神经网络框架来让人工智能自主搭建适合业务场景的网络,当前我们已经可以通过自动化机器学习(AutoML)平台产品来帮助完成机器学习流程自动化的过程,AutoML已经进入落地阶段,主要自动化机器学习产品如表1-1所示。
AutoML的出发点是用强大的算力通过更多次训练提高模型的准确度,其最大的特点是将机器学习模型的设计过程自动化。算法设计人员只需了解模型的基本概念并提供标签数据即可,神经网络的参数及结构调整是自动完成的,无须人工干预。自动化深度学习的核心技术包括深度强化学习(Deep Reinforcement Learning)、迁移学习(Transfer Learning)、数据增强、超参数优化等。随着AutoML技术的出现,深度学习模型的设计门槛大为降低。未来深度学习一定是通过大规模、自动化、定制化的设计来满足企业/个人的需求。在自动化深度学习中,深度学习的模型和网络结构会像工业产品一样被大规模生产出来,以适应不同应用场景、不同硬件、不同数据模态的需求。AutoML已成为降低深度学习算法开发和设计难度的重要工具。
表1-1 主要自动化机器学习产品
Google提出让深度学习平民化,让所有人都拥有深度学习建模的能力,2018年1月,Google发布了提供自定义图像识别系统自动开发服务的Cloud AutoML Vision,用户从导入数据到训练模型都可以通过拖放式界面完成。AutoML已经被Google应用于CIFAR-10高度基准测试数据集,并且训练出了与人工设计不相上下的模型。Google Cloud AutoML基于渐进式架构搜索技术和迁移学习方法,目前开放了图像分类、自然语言处理和翻译功能。微软的Custom Vision Services为用户提供视觉模型自动训练解决方案。亚马逊利用其云平台在数据体量与用户工具方面的优势,提供Amazon ML机器自动建模服务,其主要技术依赖于预先优化的经典模型。
在国内,百度提出“开放普惠AI”的理念,认为深度学习网络设计的能力应该开放,应该降低门槛,让所有开发者都拥有这项能力。百度发布的AutoDL,大幅降低了深度学习技术门槛并实现高效定制。AutoDL可以看作用深度学习来设计深度学习,从而实现让广大开发者都能够快速运用深度学习。阿里云机器学习平台构建在阿里云MaxCompute之上,通过对底层分布式算法的封装提供拖曳可视化操作环境。