<small id="ljz7a"><delect id="ljz7a"></delect></small>

    1. <code id="ljz7a"></code>

        <small id="ljz7a"><delect id="ljz7a"></delect></small>
      1. 首頁 科技資訊 業界

        Graphcore IPU進入中國 能否攪動AI芯片市場?

        【TechWeb】6月23日消息,不是老套的CPU、GPU,AI應該需要一塊專屬芯片。這個想法讓全球更多創企看到挑戰巨頭的機會。

        今年2月EE Times評選出“十大AI芯片創企”,其中來自英國的Graphcore憑借其為AI計算而生研發的IPU獲選。

        英國半導體之父、Arm的聯合創始人Hermann更是對Graphcore給予高度評價,他曾表示:“在計算機歷史上只發生過三次革命,一次是70年代的CPU,第二次是90年代的GPU,而Graphcore就是第三次革命。”

        資料顯示,Graphcore是一家英國AI芯片硬件設計初創公司,成立于2016年,總部位于英國布里斯托,Graphcore的主要業務是設計用于AI應用程序的處理器,為云服務等應用提供產品支持。

        Graphcore的核心技術和產品是智能處理器(IPU)硬件和相應的 “Poplar” 軟件,該軟件專門針對AI應用程序所需要的密集型計算而設計,以及IPU系統解決方案。目前其IPU GC2處理器已經量產。

        截至目前,Graphcore已經獲得超過4.5億美元的融資,戰略投資者不乏寶馬、博世、戴爾、微軟、三星等各行業巨頭。Graphcore最近的一輪融資在今年2月完成,公司估值已達19.5億美元。

        去年,這家AI芯片創企Graphcore將業務拓展至中國,我們也得以近距離了解這家企業的產品和中國市場愿景。

        IPU為AI而生 16納米GC2處理器已量產

        今年5月27日,在英國Intelligent Health峰會上,微軟機器學習科學家分享了使用IPU訓練CXR模型的卓越性能:IPU在運行微軟COVID-19影像分析算法模型時能夠在30分鐘內完成訓練,而在NVIDIA GPU上這項工作需花費5個小時。

        Graphcore高級副總裁兼中國區總經理盧濤

        Graphcore IPU一戰成名。

        Graphcore高級副總裁兼中國區總經理盧濤介紹,之所以IPU能有如此優異的表現,是因為 “Graphcore的IPU是為機器智能專門設計的、完全不同的處理器架構,跟CPU、GPU等處理器架構非常不一樣”。

        盧濤表示,CPU是針對應用和網絡進行設計的處理器,是標量處理器。GPU是針對圖形和高性能計算、以向量處理為核心的處理器,而Graphcore IPU是針對計算圖的處理來設計的處理器。

        具體而言,“IPU應用了大規模并行MIMD的處理器核。另外進行了非常大的分布式片上SRAM,在片內IPU能做到300 MB的SRAM。相對CPU的DDR2子系統或GPU的GDDR、HBM來說,IPU能做到10到320倍的性能提升。從時延的角度看,與訪問外存相比,IPU時延基本為1%,可以忽略不計。” 盧濤透露。

        以Graphcore已經量產的IPU GC2處理器為例,盧濤介紹道:“這款產品采用TSMC 16納米工藝,是擁有236億個晶體管的芯片處理器。它在120瓦的功耗下能夠達到125TFlops的混合精度,內存帶寬為45TB/s、片上交換可達45TB/s、片間IPU-Links為2.5TB/s。GC2上有1216個獨立處理器核心(Tile),其300MSRAM能夠把完整的模型放在片內。”

        據悉,Graphcore采用構建大規模數據中心集群的BSP(Bulk Synchronous Parallel)技術,該技術目前在谷歌、Facebook、百度這樣的大規模數據中心都已獲得應用。

        盧濤強調:“IPU是目前全球第一款BSP處理器,通過硬件能支持BSP協議,并通過BSP協議把整個計算邏輯分為計算、同步、交換。對軟件工程師或開發者來說,這將非常易于編程;而用戶也無需糾結于這里面是1216個核心(Tile)還是7000多個線程、任務具體在哪個核上執行,因此這是一項非常用戶友好型的創新。”

        與IPU相輔助的是Poplar軟件,該軟件專門針對AI應用程序所需的密集型計算而設計。盧濤透露:“目前Poplar已提供750個高性能計算元素的50多種優化功能,支持標準機器學習框架,如TensorFlow、ONNX和PyTorch,很快也會支持百度飛槳。在部署方面,目前Poplar可以支持容器化部署,能夠快速啟動并運行。在標準生態方面,Poplar能夠支持Docker、Kubernetes,以及Hyper-v等虛擬化技術和安全技術。在操作系統方面,目前Poplar SDK支持最主要的三個Linux發行版:ubuntu、RedHat Enterprise Linux、CentOS。”

        IPU服務AI優勢凸顯 比GPU效率大幅提升

        目前基于IPU的應用已覆蓋到包括自然語言處理、圖像/視頻處理、時序分析、推薦/排名及概率模型在內的多個機器學習應用領域。

        Graphcore中國銷售總監朱江

        “在自然語言處理、計算機視覺類應用和概率類算法中,IPU的表現在現有以及下一代模型上,性能均領先于GPU。”Graphcore中國銷售總監朱江介紹, “在自然語言處理方面,IPU速度能夠提升20%至50%;在圖像分類方面,IPU能夠達到6倍的吞吐量和更低時延;在MCMC算法方面,IPU具有26倍的性能提升;在ResNeXt這類比較新的計算機視覺類應用方面,IPU能做到6倍的吞吐量、22分之1的時延。”

        朱江以BERT模型為例進行了對比。BERT訓練在NVLink-enabled的平臺上,大概50多個小時才能做到一定精度,而在基于IPU的戴爾DSS-8440服務器上,只需要36.3小時,相當于訓練時間縮短了25%。

        如果做一個分組卷積內核的micro-benchmark,將組維度(group dimension)分成從1到512來比較。這里組維度512就是應用得較多的 “Dense卷積網絡” ,典型的應用如ResNet。此時IPU GC2性能比V100要好近一倍。

        隨著稠密程度降低、稀疏化程度增加,在組維度為1或32時,針對EfficientNet或MobileNet,IPU對比GPU展現出巨大的優勢,可以達到成倍的性能提升,同時時延大大降低。

        據朱江介紹,Graphcore IPU現已廣泛應用于金融、醫療、電信、搜索引擎等諸多垂直領域,并在這些領域表現出顯著優勢。

        除了前面提到的IPU在運行微軟COVID-19影像分析算法模型時的優異表現外,在金融領域,包括算法交易、投資管理、風險管理及詐騙識別等方面,IPU可以使MCMC采樣速度提高26倍,強化學習的訓練時間縮短至1/13。

        電信領域,LSTM模型預測性能促進網絡規劃,基于時間序列分析,采用IPU比GPU有260倍以上的提升。

        朱江總結道:“IPU是一個全新的架構設計、是一個圖形處理器,具備多指令、多數據的特點。除了稠密的數據之外,現在代表整個AI發展方向的大規模稀疏化數據,在IPU上處理就會有非常明顯的優勢。”

        進入中國已與百度阿里合作 7納米IPU新品今年發布

        現在Graphcore攜其IPU登陸中國市場,以期在中國市場大展拳腳。

        目前,如果用戶想訪問IPU系統,可以通過購買戴爾服務器或微軟云來訪問IPU資源。在中國,Graphcore和金山云合作,即將上線針對中國開發者和創新者的云業務。

        盧濤透露,今年5月12日,在OCP Global Summit上,阿里巴巴宣布Graphcore支持ODLA的接口標準。隨后5月20日,在百度Wave Summit 2020上,百度宣布Graphcore成為飛槳硬件生態圈的創始成員之一。Graphcore希望通過這樣的方式來積極融入中國的AI生態圈。

        在談到中美AI市場的差異時,盧濤向TechWeb表示:“目前,美國在IPU的落地與推進速度方面比中國要更快一些,不過現在中國的推進速度也愈發快速。這是因為美國用戶更多來自于較為活躍的研究者社區,而中國用戶非常注重產品落地。國外的AI應用更加側重研究,而中國更加看重產品化的訓練和產品化的推理,更加側重AI如何解決應用問題。”

        為了適應這一市場差異,盧濤介紹:“長期來講,Graphcore會針對中國市場的需求,進行產品的定制化。從服務角度而言,Graphcore中國目前有兩支技術團隊——一支是以定制開發為主要任務的工程技術團隊,另一支是以對用戶技術服務為主的現場應用團隊。工程技術團隊承擔兩方面工作,一是根據中國本地的AI應用特點和需求,將AI的算法模型在IPU上實現落地;二是根據中國本地用戶對AI穩定性學習框架平臺軟件的需求,進行功能性的開發加強工作?,F場應用團隊則是幫助客戶完成現場的技術支持工作。”

        盧濤說:“我們對中國市場的期望非常高,期望中國市場能夠占到Graphcore全球市場的40%甚至50%。雖然Graphcore在中國市場的整體啟動比北美要晚一年左右,但從目前進展來看,我們發展得非常不錯。”

        另據盧濤透露,Graphcore下一代7納米處理器將于今年下半年正式發布,相信新產品會有卓越表現。

        官方微博/微信

        每日頭條、業界資訊、熱點資訊、八卦爆料,全天跟蹤微博播報。各種爆料、內幕、花邊、資訊一網打盡。百萬互聯網粉絲互動參與,TechWeb官方微博期待您的關注。

        ↑掃描二維碼

        想在手機上看科技資訊和科技八卦嗎?

        想第一時間看獨家爆料和深度報道嗎?

        請關注TechWeb官方微信公眾帳號:

        1.用手機掃左側二維碼;

        2.在添加朋友里,搜索關注TechWeb。

        手機游戲更多

        吉林快三计划