收购迈络思之后,英伟达已经成为一家数据中心公司

中国IDC圈 英伟达宣布将斥资69亿美元收购数据中心网络公司迈络思(Mellanox),令包括长期关注英伟达的人士在内的许多人感到意外。这是迄今为止英伟达最大的一笔收购

 

它之前收购的公司规模要小得多,而且常常以低价收购。相对而言,2001年收购竞争对手3dfx是最贴切的类比,正如笔者所说的那样,当时英伟达的规模要小得多。购买3dfx资产并雇佣100名员工是一个更合理的举措,因为新资产可以立即加入英伟达的核心业务——电脑制图

收购迈络思之后,英伟达已经成为一家数据中心公司

而迈络思则来自一个完全不同的业务领域,数据中心网络。它的产品补充了英伟达的产品,两者之间没有重叠。通过这次收购,英伟达表明了它不仅仅是一家GPU公司的严肃态度。随着其加速器业务的指数级增长,并进入相关网络,英伟达现在已经是一家数据中心公司

收购迈络思之后,英伟达已经成为一家数据中心公司

2019GTC大会 迈络思首席执行官Eyal Waldman(左)、英伟达首席执行官黄仁勋(右) 图片来源:TIRIAS RESEARCH

 

收购迈络思有很多有趣的方面值得探讨,包括:英伟达进一步进入以色列科技行业;其它依然留在迈络思(EZChip和Tilera)的计算相关资产;黄延森的管理风格将如何在以色列发挥作用;迈络思支持CCIX计算加速器连接协议与NVIDIA自己的NVLink。这些我们留待以后讨论,现在让我们重新认识一下并购后的英伟达

 

英伟达是如何成为一家数据中心公司的?

这一切都始于斯坦福大学在2006年左右的一项发现,使用图形处理单元(GPU)处理一些计算密集型工作负载,相对于传统处理器或CPU而言,每瓦特的性能有了显著提高。原来,所有用于处理像素的小计算元素都可以用于粗略的科学计算。该领域最初被称为GPU计算。与此同时,图形也变得越来越复杂,功能齐全的数学处理功能也被添加到GPU中。英伟达的一些人,包括Bill Dally教授和已故的John Nicholls,他们注意到有机会扩展GPU的使用,并在高性能计算(HPC)市场上做出显著的改变

因此,英伟达在其GPU中为高性能计算工作负载添加了更多功能,并开发了模仿Quadro专业工作站产品线的特斯拉产品线该公司还为其GPU开发了CUDA编程框架,但从未支持任何其他GPU。与之竞争的主要GPU供应商AMD选择等待OpenCL的开发,而OpenCL的开发速度要慢得多。

英伟达在高性能计算领域非常成功,在全球超级计算机500强中名列127位,并为世界上速度最快的两台超级计算机提供动力,美国能源部橡树岭国家实验室的Summit和劳伦斯利弗莫尔国家实验室的Sierra。

 

收购迈络思之后,英伟达已经成为一家数据中心公司

黄仁勋介绍其PRADA架构的含义 图片来源:TIRIAS RESEARCH

 

从芯片到系统

 

在黄仁勋的主题演讲中,他提出数据科学现在是科学方法的第四大支柱英伟达意识到数据科学家和人工智能研究人员的短缺,因此,这些人的生产力很重要,为了保持这种势头,将资源给到更多的开发人员很重要。为此,该公司设计了DGX工作站和服务器,完全装载CUDA-X工具和库,用于机器学习研究。该公司正通过戴尔、惠普和联想等多家系统OEM厂商的新数据科学平台,将触角伸向数据科学家

即使有了新的系统和工具,该行业仍然面临着从艾字节(Exabyte, EB)级别的新数据和现有数据中整理业务和科学见解的挑战。这正促使数据科学努力解决数据过多的问题。当自动驾驶汽车完全成型时,它们产生的需要处理的信息将会是EB级别的。这就是为什么英伟达认为越来越多的数据中心将需要内置人工智能处理来对所有这些数据进行排序

 

超级计算机和超大规模数据设施

 

在HPC方面的工作中,英伟达专注于在非常大的问题(按比例放大)上实现最大的计算性能超大规模数据中心通常有许多计算任务同时运行(向外扩展)。数据科学的需求正好处于大数据集和多用户之间,并且具有向上和向外扩展的特性。

为了满足这些不同的需求,英伟达已经与迈络思建立了许多服务器项目,迈络思提供机架网络。由于迈络思的成功,它成为了各大元器件和云服务公司的收购目标,包括英特尔和微软等公司。

然而,迈络思没有选择这些公司中的任何一家,而是选择了像英伟达这样更友好的合作伙伴。当有机会成为迈络思的买家时,黄仁勋欣然接受了这个机会。随着Hadoop、SPARC和RAPIDS等数据分析程序所带来的日益增长的容器化和工作负载的超伸缩性,他看到机架到机架的通信呈指数级增长,这通常被称为数据中心中的自东向西通信。因此,低延迟网络已成为创建计算结构的关键。迈络思的网络技术可以使数据中心足够灵活,以适应这些不断变化的工作负载。迈络思的关键开发是将网络任务从CPU转移到加速器,在未来,它将把人工智能添加到其切换产品中,以更有效地移动数据。

对于服务器扩展应用程序(如HPC),目标是使多个GPU像一个巨型GPU一样工作。这就是英伟达的NVLink发挥作用的地方,它将多个GPU捆绑在一起形成一个集群。对于更广泛的向外扩展的基础设施来说,可以部署特斯拉T4卡。这些70W半高PCIe卡适合2U机架底盘,使这些卡可以自由地添加到现有的数据中心。T4是英伟达提供的最灵活的数据中心——它可以用于推理、训练(只是速度不如V100)、数据科学、视频代码转换和VDI(虚拟桌面)应用程序。T4还没有得到足够的重视,但在未来,云计算和边缘应用程序将更加重视推理。这也是英伟达面临英特尔和不断壮大的初创企业大军的最大竞争领域。

虽然有许多竞争者争夺人工智能加速器的宝座,但英伟达产品仍然是安装了最大软件的王者。收购迈络思之后,它只是扩大了它的数据中心领域。

 

本文由 产业新干线 作者:NovaLink 发表,其版权均为 产业新干线 所有,文章内容系作者个人观点,不代表 产业新干线 对观点赞同或支持。如需转载,请注明文章来源。

发表评论