《架构师》2016年7月
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

现在Google制造自己的芯片Intel要发疯

作者 CADE METZ 译者 大愚若智

GOOGLE已经制造出自己的计算机芯片,而事情还远没有结束。

整个互联网上最强大的公司昨天在科技界抛出了几枚重磅炸弹,披露了全新的定制化芯片,借此这家庞大的在线帝国可以更好地经营未来的主营业务:人工智能。

为了制造自己的芯片,Google在改造了科技界的很多东西之后,又向前迈近一步。为巩固各类在线服务,过去十多年来这家公司为自己的大规模数据中心设计了各种新硬件,包括计算机服务器、网络设备等。随着服务范围和规模达到一个空前的高度,他们需要通过更高效的硬件运行这些服务。多年来,其他很多互联网巨头也曾效仿这种做法,以此为契机全球硬件市场产生了翻天覆地的变化。

Google在芯片制造方面努力的结果辐射范围已经超越了Google帝国本身,甚至让芯片行业的未来受到威胁。

对于这款新芯片,Google的目标始终未变:空前的高效。为了让AI技术跃上一个新高度,他们需要一种能在更低能耗前提下,用更短时间完成更多任务的芯片。但这个芯片所产生的效果已经超越了Google帝国本身,甚至让Intel和nViaia这样的商业化芯片制造商的未来受到威胁,尤其是考虑到Google对于未来的愿景,这种情况显得更为紧迫。根据在Google帝国的巩固之路上主要负责全球数据中心网络的Urs Hölzle所说,新的定制芯片只是万里长征的第一步。

不,Google不打算将自己的芯片出售给其他公司,他们不会与Intel或nVidia直接竞争。但考虑到这家公司的数据中心规模之大,Google目前已经是这些芯片公司最大的潜在客户。与此同时,随着越来越多企业开始使用Google提供的云计算服务,他们自行购买的服务器(以及芯片)数量只会越来越少,这等于进一步蚕食了芯片制造商的市场份额。

确实,Google公布有关新芯片的新闻只是为了宣传自家的云服务业务,让更多企业和开发者选用自家的AI引擎,并将其用于自己的应用程序中。随着Google开始将AI的强大能力出售给其他公司,这实际上是在(以相当高调的方式)宣称他们可以提供运行这种AI的最佳硬件,而且绝无仅有的硬件。

Google对速度的渴求

Google的新芯片叫做Tensor Processing Unit(张量处理器),即TPU。这是因为这种芯片更适合运行TensorFlow,正是这个软件引擎驱动着Google的深度神经网络,硬件和软件组成的网络可以通过分析海量数据学习如何完成特定任务。其他技术巨头通常使用图形处理器,即GPU运行自己的深度神经网络,而这GPU最初是针对游戏和其他图形密集型应用程序的图像渲染任务设计的。虽然GPU在设计上很适合用于运行驱动深度神经网络所需的计算任务,但Google认为如果使用定制芯片可以进一步提高效率。

根据Google的介绍,他们结合机器学习的具体需求对TPU的规格进行了调整,用更少量事务就可以运行每一步操作。这意味着这样的芯片每秒钟都能执行更多操作。

目前Google同时使用TPU*和*GPU运行自己的神经网络。Hölzle拒绝详细介绍Googe对于这种TPU的使用方式细节,不过透露说这种技术可以处理驱动Android手机语音识别功能所需的“部分运算量”。同时他还说Google即将发布一篇介绍这种芯片好处的论文,并且还会继续设计能够以其他方式处理机器学习任务的新芯片。最终,他们的目标是彻底停止使用GPU。“已经取得一些进展了,”Hölzle说:“对机器学习来说,GPU还是不够专精,毕竟从设计上就不是针对这种用途的。”

nVidia可不愿意听到这种说法。作为全球最主要的GPU经销商,nVidia正在急迫地将自家业务拓展到AI领域。同时Hölzle也提出,最新款nVidia GPU包含一个专门的机器学习模式。但是很明显,Google希望这个变化能够进行的快点,再快点。

最智能的芯片

与此同时,其他公司,尤其是Microsoft也在芯片之路上进行着探索。场效可编程门阵列(Field-programmable gate array, FPGA)就是一种可以通过重新编程执行特定任务的芯片。Microsoft已经测试过FPGA在机器学习领域的运用,而Intel也明确了市场的发展方向,最近收购了一家销售FPGA的公司。

一些分析师认为这才是最明智的发展之路。密切关注芯片制造业务的Moor Insights and Strategy事务所总裁兼首席分析师Patrick Moorhead认为FPGA可以提供更高灵活性。Moorhead怀疑Google新发布的TPU是否有些“过犹不及”,并指出制造这样的芯片至少需要六个月,在竞争日趋激烈的市场中,六个月时间已经太长了,并且还要与最大的互联网公司展开竞争。

但Google不想要这样的灵活性。对他们来说,速度的重要性超越一切。在被问到为什么Google要从零开始制造自己的芯片而不是使用FPGA时,Hölzle说:“只是想实现更高的速度。”

核心业务

Hölzle还提到Google的芯片并不是为了取代CPU。中央处理器是所有计算机服务器的心脏,这个搜索巨头依然需要使用这种芯片运行数据中心内成千上万的服务器,而CPU是Intel的主营业务。当然如果Google愿意专门为了AI打造一款自己的芯片,那么人们不禁好奇他们是否打算更进一步重新设计自己的CPU。

Hölzle淡化了这种可能性。“只需要解决尚未解决的问题,”他说。换句话说,CPU是一种成熟的技术,已经可以按照预期正常工作。但同时他也说,Google希望芯片市场能够呈现出良性竞争的环境。也就是说,他们希望从多家经销商处购买,而不只是购买Intel的产品。毕竟更激烈的竞争对Google而言意味着更低的价格。同时Hölzle也解释说,Google正是为了能获得更丰富的选择而与OpenPower基金会合作,这家机构的目标是提供任何人都可以使用和修改的芯片设计。

这是个很强大的想法,同时对全球最大的芯片制造商来说也是一个很强大的潜在威胁。根据IDC研究公司分析师Shane Rau所说,全球服务器CPU出货总量中有大约5%是Google购买的。他说在最近一年内,Google购买了大约120万块芯片,其中大部分来自Intel。(2012年,Intel高管Diane Bryant告诉WIRED说Google从Intel处购买的服务器芯片数量远远超过其他五家客户,而其他这些客户全都是销售服务器的公司。)

无论对CPU有何计划,Google还将继续探索更适合机器学习需求的芯片,而我们要等到很多年后才能知道什么可行,什么不可行。毕竟神经网络这个概念本身也在继续进化。“我们的探索从未中断,”他说:“但最终答案是什么我还不知道。”可以肯定的是,随着Google继续探索,全世界的芯片制造商都在密切关注。