首页 云计算 服务器 大数据 存储 IT 安全 物联网 软件 案例库

服务器

数据中心频道旗下栏目: 虚拟化 服务器组件 虚拟桌面 数据中心 高性能计算

探访LinkedIn公司的数据中心

来源:网络整理   发布时间:2019-04-26
摘要:毫无疑问,为了支持领英公司(LinkedIn)遍及世界各地的4.67亿的注册会员,该公司需要消耗大量的功率,特别是考虑到该网站的每名注册成员都会获得相当个性化的页面访问体验:一个专属的访问网页,而该页面仅仅只包括他们的联系人信息。而为这些负载提供支持

毫无疑问,为了支持领英公司(LinkedIn)遍及世界各地的4.67亿的注册会员,该公司需要消耗大量的功率,特别是考虑到该网站的每名注册成员都会获得相当个性化的页面访问体验:一个专属的访问网页,而该页面仅仅只包括他们的联系人信息。而为这些负载提供支持的是该公司跨多处数据中心的共计约100,000台服务器。为了进一步详细的了解领英公司是如何实现这一切的。

最近,NetworkWorld.com网站的首席编辑John Dix与领英公司的生产运营兼IT副总裁Sonu Nayyar及其基础设施工程高级总监Zaid Ali Kahn进行了一次深度的访谈。

 

图1、领英公司位于俄勒冈州希尔斯伯勒县的新数据中心

让我们先从宏观大局出发,有请二位先大致谈谈贵公司遍及全球世界各地的数据中心吧。

图2、LinkedIn公司生产运营兼IT副总裁Sonu Nayyar

Nayyar:在美国,我们有三处主要的数据中心负责为全球的LinkedIn.com网站提供服务,一处位于德克萨斯州的理查德森,一处位于弗吉尼亚州的Ashburn,还有一处是我们刚刚在俄勒冈州希尔斯伯勒县最新打造的数据中心。在2016年早些时候,我们还在新加坡建立了一处较小的数据中心,其主要目的是提升我们在亚太地区市场的注册会员们的访问体验。其基本上是一套完整的数据,但只适用于亚太地区的会员。所有四处数据中心都由我们的MPLS骨干和13个全球入网点(POP,point-of-presence)连接。

图3、LinkedIn公司基础设施工程高级总监Zaid Ali Kahn

这几处数据中心都是相似的架构吗?还是说这些数据中心是在不同时期建造的,故而是一种混合呢?

Nayyar:我们有一种混合。之前,我们在Ashburn建立了我们的第一处数据中心,最开始使用的是托管的设备。显然,该技术正逐年发展完善,现在,俄勒冈州的数据中心已然获得了一套完整的升级功能。

Kahn:我们在弗吉尼亚州数据中心的打造是我们公司开始转向批量模型的时候。因此,我们没有使用诸如Equinix等公司的像零售商一样的计算容量能力,而是租用了数据中心空间——其基本上是一个大空壳,内置了一切内容,包括电源、配电通道、机架等等。而且,在弗吉尼亚的数据中心建成之后,我们又在德克萨斯州兴建了另一处,因为我们得以能够很快的实现规模化。而当我们决定兴建俄勒冈州的数据中心时,我们能够退后一步,反思我们希望我们未来的数据中心到底是怎样的。这就是我们转换到超大规模模型的时候了。展望未来,我们将把我们其他的数据中心也改造为这一新的模型。

贵公司并没有也像其他一些网络巨头一样,在构建你们自己的服务器,对吧?

Kahn:是的,我们正在使用独立的机架式服务器。我们与OEM供应厂商密切合作,以确保它们满足并符合我们的性能规格等要求。我们是思科UCS的第一批大用户之一,但我们已经开始更多地转向Supermicro商用硬件了。

这些数据中心是否也支持您企业的业务需求?

Nayyar: 我们有一个混合的模式。我们在加利福尼亚州的圣克拉拉有一个小型的数据中心,在该数据中心有我们的企业数据中心资源,包括人力资源、财务、开发、预备生产等——但我们也兴建了俄勒冈州的数据中心,以便使得我们可以使用安全区域,以便从任何数据中心都能够支持企业的这些需要。

面向客户的LinkedIn应用程序是什么样的?

Nayyar:我们的应用程序是很复杂的。因此,数据中心中的所有内容都是为了支持在您访问LinkedIn.com网站时所呈现的页面。你可以想象,每位注册会员访问我们网站时采用的是不同的连接,而且,每个会员所看到的页面也都是高度定制化的,而生成每个定制化的页面会在我们的数据中心产生海量东西走向的流量。而随着海量计算负载的继续。对于进入我们的企业网络的每个字节的数据,我们都会100倍的由东向西生成页面。

Wow。真是不简单呢!

Nayyar:通过我们的应用程序,一切都实现了连接。当然,我们网站的一些部分是独立的,如招聘人员有不同的界面。但对于一般性的消费者成员,LinkedIn.com都是连接的。

Kahn:我们有多种产品和数千种服务。你可能听说过Rest.Li框架,这是我们谈论得最多的网关集成之一,当这些东西进行通信时,最终还是归结为大量的数据在数据中心之间迁移。

图4、具备LinkedIn公司的超高密度数据中心设计的服务器行

每处数据中心是否支持相同的负载还是各自分配不同的职责呢?

Nayyar:任何一处数据中心站点都可以为流量提供服务。如果某处数据中心发生故障,我们只需将流量路由传输到另一个站点。在我们的100Gbps MPLS骨干网上,所有数据中心之间正在进行着实时的复制。他们都服务于同样的工作负载,这便是我们如何提高我们的可用性的秘诀所在。如果在某一处站点发生中断,无论其是一个bug、网络问题、电源问题、甚至不好的变化,我们均可以轻松地在五分钟内将相应的流量导出。所有这些数据中心一起工作,服务于LinkedIn.com网站。

贵公司的服务是否是按照不同的地理区域来划分的?

Kahn:是的。我们是Anycast(其具备从网络中的多个点推广一个IP地址的能力)的重度用户,这意味着我们可以将我们的成员路由传输到最接近的POP。

Nayyar:我们试图找出哪个国家地区的哪一部分的用户的流量需求应该被路由传输到哪里,并将其路由传输到最近的POP。 POP是小规模的数据中心,主要是网络设备和代理服务器,它们充当了用户的TCP连接请求的终端。

Kahn:我们根据注册会员的访问体验来选择POP的位置。我们知道在哪些地区面临相应的挑战。我们有一个用于进行预测分析的数据科学模型,其显示:如果我们在澳大利亚投放一个POP,那么页面加载时间将提高X%。然后,我们必须在这些地理区域构建POP,并将它们绑定到我们的数据中心。所有的繁重的页面处理是在POP进行的,然后有后端数据连接,但POP有助于使页面的加载时间更快。通过在亚洲市场仅仅投放一个POP,我们就已经看到,网页加载速度提高了25%。