目前數(shù)據(jù)中心主流的三種系統(tǒng)架構是 ARM、POWER 以及 x86。OpenPOWER 基金會是面向所有 POWER 產品的生態(tài)系統(tǒng),也是一個協(xié)作式的開源組織,旨在挑戰(zhàn)和顛覆傳統(tǒng)x86架構在業(yè)內的主導地位。隨著每年都有很多公司加入、注冊成為供應商和客戶,OpenPOWER不斷壯大,現(xiàn)在擁有 325 個成員。我關注過 OpenPOWER 一段時間,如果感興趣,可以看一下我兩年前在此發(fā)布的關于這個基金會的文章。此外,隨著 IBM POWER9 CPU 第一和第二階段的推廣,最近將會出現(xiàn)針對 POWER 系統(tǒng)基礎架構和 CPU 前端的大動作。
今天在拉斯維加斯舉辦的 OpenPOWER 峰會上,我傾聽了許多領先的硬件、軟件和云計算供應商的論述,了解了他們如何將全新的 POWER9 應用到其基于 OpenPOWER 的新產品當中。正值此基金會邁向第五個年頭之際,我想分享一些自己對這款新產品的看法,并圍繞此基金會進行一番討論。因為 POWER 架構具備加速功能、大量核心和超大內存,我對其印象十分深刻,在今年的峰會上,我非常關注使用這項技術的新客戶。全場最為轟動的時刻當屬谷歌確認已經將 POWER 部署到他們的數(shù)據(jù)中心當中,這對于 OpenPOWER 來說是一件非常重大的事情。
一系列新解決方案紛紛亮相
POWER 架構最大的優(yōu)勢在于其加速功能(GPU、FPGA、DSP 以及 ASIC)和新增的內存一致性功能。POWER 架構上這些新增的卡片或芯片通過直接的 CPU 加速,可以為機器學習、大數(shù)據(jù)、安全與網絡工作負載提供卓越支持力量。全新的 POWER9 配備了一系列引人注目的尖端技術,包括 NVIDIA NVLink、OpenCAPI 以及 PCIe Gen4。POWER9 提供比 x86 多四倍的每內核線程數(shù)量和多達 9.5 倍的內存帶寬,專為大數(shù)據(jù)、人工智能和機器學習工作負載而生。當然,這也為 OpenPOWER 基金會的成員創(chuàng)造了一系列全新的發(fā)展機會,他們的發(fā)展成果也在此次峰會上悉數(shù)亮相。
OpenPOWER 生態(tài)系統(tǒng)不斷發(fā)展壯大OpenPOWER 生態(tài)系統(tǒng)不斷發(fā)展壯大
Atos、Gigabyte、Hitachi、Inspur、Inventec、Rackspace、Raptor、Wistron 等基金會成員紛紛在此次峰會上宣布部署全新的 POWER 服務器。此外,Alpha-Data、Amphenol、Cavium、Mellanox、Nallatech、Rambus 以及 Xilinx 宣布采用全新的OpenCAPI 設備,以此利用 POWER9 顯著的內存帶寬優(yōu)勢。Broadcom Limited、Eiditicom 和 NEC 宣布部署了全新的 PCIe Gen4 設備,他們聲稱這些設備將加快OpenPower平臺的計算、聯(lián)網和存儲流程。在軟件方面,brytlyt、Elinar Oy、ISVs H20、MapD 等公司也在本次峰會上宣布實施了一系列全新的 OpenPOWER 可兼容產品。其中,POWER9 的專攻領域——人工智能和現(xiàn)代數(shù)據(jù)工作負載,受到許多公司關注。我將深入跟蹤本次峰會,了解有關這些新產品的詳細信息。
Google 確認部署舉動
OpenPOWER 峰會上最為轟動的用戶新聞莫過于谷歌確認已將“Zaius”平臺部署到他們的數(shù)據(jù)中心,用于處理生產工作負載。谷歌公司的 Maire Mahoney 今天站在峰會的舞臺上表示“我們已經將‘Zaius’部署至谷歌的數(shù)據(jù)中心,并將會逐步擴大使用規(guī)模”。她最后說,她認為該平臺就是“Google Strong”。之后,Mahoney 向我解釋說“Google
Strong”指的是可靠性和穩(wěn)健性。本次峰會上宣布的其它部署活動并非不值一提,只是這個消息實在太為轟動。
Mahoney 解釋了 Google 偏愛 POWER9 的原因:
提供更多內核和線程來支持谷歌的核心搜索技術
提供更多的內存帶寬來支持 RNN 機器學習執(zhí)行流程
OpenCAPI 加速總線提供更快且“更開放”的閃存 NAND
如果谷歌愿意披露更多信息的話,我將會提出更多有關部署規(guī)模的問題。
谷歌宣布已將基于 POWER 的系統(tǒng)部署到其數(shù)據(jù)中心之中谷歌宣布已將基于 POWER 的系統(tǒng)部署到其數(shù)據(jù)中心之中
騰訊、阿里巴巴、優(yōu)步及 Limelight
IBM 表示,許多大型企業(yè)已經采用 IBM 的 Power Systems,其中包括排名前 10 的 8 家零售商、8 家保險公司、10 家電信公司、10 家銀行。同時,IBM 還表示財富 10 強企業(yè)中有 7 家、財富 20 強企業(yè)中有 12 家在數(shù)據(jù)庫中部署了 IBM POWER8。這個數(shù)字實在是很驚人,但是一些本就“生于云端”的新客戶又作何反應呢?另外,誰能說明所部署的商業(yè)工作負載實現(xiàn)了何種成果?
一些 OpenPOWER 知名成員“現(xiàn)身說法”,講解了他們的企業(yè)從 OpenPOWER 部署中獲得的諸多益處。超大規(guī)模的互聯(lián)網綜合服務提供商騰訊公司表示,自從為其企業(yè)數(shù)據(jù)中心購買了一些基于 OpenPOWER 的系統(tǒng),數(shù)據(jù)中心的效率已經提高了30%,同時機架資源和服務器資源也節(jié)約了30%。這是目前為止令人印象最為深刻的客戶感言。PayPal 表示正在利用 Power 架構的計算能力來處理大型數(shù)據(jù)集,加速深度學習進程,推進欺詐預防工作。電商巨頭阿里巴巴的旗下的“阿里云”,宣布已在阿里云-神龍云計算試點平臺上部署了 OpenPOWER 服務器,稱贊該服務器“簡單易用且兼容性強”。我將深入了解峰會上所有這些令人印象深刻的部署聲明。我會隨時關注谷歌的最新動態(tài)。
優(yōu)步表示打算在橡樹嶺國家實驗室中部署此次峰會上推出的超級計算機,用于在 27,000 個 NVIDIA GPU 上大規(guī)模測試 Horovod 項目(該公司眾多人工智能項目之一)。機器學習已經嵌入到優(yōu)步的大量技術當中,幫助該公司優(yōu)化駕駛路線,確定欺詐性客戶,為乘客提供更加準確的價格預估。
LimeLight 是一家為客戶(例如 BBC 和 Marvel Comics)提供各種數(shù)據(jù)內容流增強工具的公司,該公司表示 OpenPOWER(通過 POWER9 上的 PCIe Gen4)能夠使其突破PCIe Gen3 瓶頸問題(用其它服務器時則難以避免),從而加快內容流傳遞速度,同時減少緩沖時間。我不確定這家公司處于試用階段,還是商業(yè)部署階段,但是我會盡最大努力找到答案。
總結
OpenPOWER 基金會 OpenPOWER 生態(tài)系統(tǒng)OpenPOWER 基金會 OpenPOWER 生態(tài)系統(tǒng)
基于 POWER9 的新產品和新解決方案種類繁多,只有 OpenPOWER 憑借開放式協(xié)作模式和頑強的毅力,嚴格遵循客戶的迫切需求才能實現(xiàn)。IBM 深知,POWER9 要想取得成功,就要構建一個支持其在相關工作負載領域發(fā)揮自身架構優(yōu)勢的生態(tài)系統(tǒng),讓合作伙伴一眼就能“慧眼識珠”,同時激起他們利用這種新架構優(yōu)勢的渴望。我真切希望 OpenPOWER 基金會繼續(xù)保持良好的發(fā)展勢頭,同時也希望基于 POWER9 的新一代產品能夠在更多的客戶案例中發(fā)揮作用。