日韩一区二区三区精品,欧美疯狂xxxxbbbb牲交,热99re久久免费视精品频,人妻互换 综合,欧美激情肉欲高潮视频

歷史上的今天

今天是:2025年06月08日(星期日)

正在發(fā)生

2018年06月08日 | 對話英特爾AI硬件負(fù)責(zé)人:什么是真正的AI芯片

發(fā)布者:化羽2015 來源: 網(wǎng)易智能關(guān)鍵字:英特爾 手機(jī)看文章 掃描二維碼
隨時隨地手機(jī)看文章

出品 | 網(wǎng)易智能(公眾號smartman163

期號 | 79期(2018年訪于舊金山)

作者 | 定西


如今,AI芯片的戰(zhàn)火愈演愈烈,英特爾也是時候拿出自己的深水炸彈了,而這次天將降大任的就是最新版NNP芯片。


它的全名叫Nervana NNP-L1000Spring Crest),支持bfloat16這一業(yè)界廣泛用于神經(jīng)網(wǎng)絡(luò)的數(shù)字格式,隨著時間的推移,英特爾將在AI產(chǎn)品線上擴(kuò)展對bfloat16的支持,包括英特爾至強(qiáng)處理器和英特爾FPGA,英特爾Nervana NNP的目標(biāo)是可實現(xiàn)高計算利用率并支持多芯片互連的真正模型并行。


主導(dǎo)這一產(chǎn)品的是英特爾AI產(chǎn)品事業(yè)部(AIPG),AIPG是英特爾人工智能的拳頭部門,負(fù)責(zé)策劃和執(zhí)行關(guān)于AI方面的研發(fā)和產(chǎn)品路線,其中,Carey KlossAI硬件的負(fù)責(zé)人,自1996年以來,他一直在芯片行業(yè)從事工作。


這位芯片專家來自Nervana,這家公司2016年并入英特爾麾下,他們幾乎撐起來了AIPG的半邊天,CareyNervana公司的CEO Naveen Rao一同加入英特爾,目前,Naveen Rao擔(dān)綱英特爾AI戰(zhàn)略總策劃師,任英特爾副總裁。


這次,關(guān)于更多新款AI云端芯片的問題,網(wǎng)易智能對Carey進(jìn)行了專訪。


| 性能提升34倍 不畏懼競爭對手


問:Lake CrestSpring Crest的主要區(qū)別是什么?


CareyLake Crest是先前的設(shè)計,是更穩(wěn)定的處理器。我們在創(chuàng)業(yè)時就開始使用它。進(jìn)入更現(xiàn)代化的制程節(jié)點(diǎn),我們集成了更多的Die(硅芯片),可以獲得更快的處理速度。


我們認(rèn)為Lake Crest作為軟件開發(fā)工具(software development vehicle)更好,部分原因是因為我們?nèi)ブС至?/span>bfloat??蛻魧τ谀茉谥苯荧@得成果更興奮,而不是還需要在中間做一些工作。


關(guān)于Spring Crest的制程節(jié)點(diǎn),我們尚未公布關(guān)于哪些產(chǎn)品使用制程節(jié)點(diǎn)的任何信息。因為需要一定的時間去制造硅片,也需要時間把硅片變成新的神經(jīng)網(wǎng)絡(luò)處理器,這是延遲到2019年上市的原因。


性能方面,Lake Crest作為我們第一代處理器,現(xiàn)在被用作軟件開發(fā)工具的時候,我們實現(xiàn)了在GEMM和卷積神經(jīng)上都實現(xiàn)了非常好的計算利用率。并且這不僅僅是96%吞吐量的利用率,而是在沒有充分定制化的情況下,我們也取得了大多數(shù)情況下實現(xiàn)GEMM高于80%的計算利用率,這也是很了不起的。


當(dāng)我們開發(fā)Spring Crest這個下一代芯片時,我們保持高計算利用率,新的產(chǎn)品在性能上有34倍的性能提升。


問:此前Lake Crest的計算利用率達(dá)到了96%, 但Spring Crest的計算利用率稍微低了,這是為什么?


Carey實際上這個是我的想法,把利用率適當(dāng)下降,有些情況上確實可以實現(xiàn)98%。在沒有資源沖突,每個硅芯片都能完全運(yùn)行的情況下,可以99%甚至100%計算利用率。


每個架構(gòu)都會有些情況能夠充分利用,無論它們現(xiàn)實與否。我想在Spring Crest幻燈片上展示的是,大多數(shù)情況下都能實現(xiàn)的利用率。我們當(dāng)然可以展示在基準(zhǔn)測試中獲得100%計算利用率的例子,但是我想表示的是很多用例都會有很高的利用率。


問:芯片晚些時候上市會給英特爾在市場競爭中造成不利影響嗎?


Carey我認(rèn)為我們逐步轉(zhuǎn)向bfloat是一個重要的考慮因素, 因為如果這就是市場需要的,那么我認(rèn)為我們對它的反應(yīng)很快, 我不知道我們的競爭對手的路線圖是什么,但我認(rèn)為我們的反應(yīng)速度相對較快,所以我認(rèn)為我們不會在神經(jīng)網(wǎng)絡(luò)處理上處于劣勢。


bfloat最近變得更受歡迎,我所知道的是,在過去四個月中,有多個客戶來到我們這里并特別要求bfloat。


問:哪些類型的顧客或者行業(yè)對Spring Crest感興趣?


CareySpring Crest可以說是最高等級的Nervana神經(jīng)元處理器架構(gòu)。


因此,它有同樣的客戶,例如超大規(guī)模中心,超大規(guī)模CSP,已經(jīng)擁有相當(dāng)強(qiáng)大的數(shù)據(jù)科學(xué)工作的大型企業(yè)客戶,例如政府和其他企業(yè)。


我想從另一種角度來回答這個問題,哪些客戶對此不感興趣。數(shù)據(jù)科學(xué)或人工智能還是比較新的,這是一個非常熱門,非常激動人心的領(lǐng)域,而且正在迅速改變。傳統(tǒng)的企業(yè)客戶可能擁有數(shù)據(jù),但他們可能無法在其數(shù)據(jù)中心部署高端設(shè)備。我們作為英特爾提供的服務(wù),以及我們的路線圖和我們的總體策略是提供整個產(chǎn)品組合。你可以基于nGraphXeon開始工作。你的數(shù)據(jù)中心已經(jīng)部署了英特爾至強(qiáng)處理器,那你沒有理由再去購買神經(jīng)網(wǎng)絡(luò)處理器或者其他類似產(chǎn)品。你有了至強(qiáng)并且圍繞至強(qiáng)做一些工作,你可以得到你的數(shù)據(jù)狀態(tài)。


但如果你發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)可以幫助你,并且嘗試找到如何能夠讓它賺錢,這時候你可以說你更加嚴(yán)肅認(rèn)真對待它,當(dāng)然英特爾可以提供神經(jīng)網(wǎng)絡(luò)處理器產(chǎn)品,能夠讓你更嚴(yán)謹(jǐn)?shù)厝ミM(jìn)行訓(xùn)練?,F(xiàn)在你可以購買很多NNP產(chǎn)品,并可以運(yùn)用相同的軟件棧,你可以獲得相同的優(yōu)化和優(yōu)化路徑,你可以為不同的硬件進(jìn)行優(yōu)化。甚至你可以用不同的Crest或者Xeon,這取決你想要干什么。或者,你已經(jīng)開始了訓(xùn)練階段,你的數(shù)據(jù)科學(xué)家開始嘗試去訓(xùn)練不同的模型,現(xiàn)在你的需求是大規(guī)模部署推理階段。


重中之重是,不是一種解決方案滿足所有需求,如果你需求的是低延且小模型,至強(qiáng)就能幫助到你,它可以把數(shù)據(jù)從云到端手機(jī)起來。如果是一些大型模型,而不是只處理一種類型的數(shù)據(jù),你需要一些更具體能夠進(jìn)行推理的部署。這就是和我們今天早上宣布有關(guān),這里潛在蘊(yùn)含著,我們正計劃給數(shù)據(jù)中心提供推理加速,當(dāng)然更多細(xì)節(jié)不能透露。


AI英雄 | 英特爾AI硬件負(fù)責(zé)人Carey Kloss:什么是真正的AI芯片


| 整合資源快速迭代 初始團(tuán)隊只有45


問:在開發(fā)新芯片的時候你們遇到了什么樣的困難?


Carey我們先來談一下Lake Crest,我們創(chuàng)業(yè)初期就開始研發(fā)Lake Crest,我們整個團(tuán)隊大概45人,當(dāng)時正在構(gòu)建一個最大的Die(硅芯片),我們開發(fā)了Neon,我們還構(gòu)建了云棧,這些都是40-45人團(tuán)隊所完成的。


這就是挑戰(zhàn),公司成立在2014年,直到去年芯片才真正問世,3年的時間不短,現(xiàn)在一切都是新的,我們現(xiàn)在屬于英特爾,可以訪問英特爾的資源,流程也變得簡單,同時也有足夠的員工同時進(jìn)行處理器多代開發(fā),就像一個真正CPU公司。


我認(rèn)為我已經(jīng)具備了明年取得成功所有要素,小團(tuán)隊成長會有陣痛,我們花了很長時間才把第一批產(chǎn)品拿出來,但我們現(xiàn)在處于合理的節(jié)奏中,現(xiàn)在我們每年都會看到改進(jìn),當(dāng)前我們的人員配置合理,資源配置合適,能夠更好的展開工作。


問:但整合所有需要的資源并不是一件容易的事吧?


Carey當(dāng)然不是一件容易的事情,但英特爾在將產(chǎn)品推出市場方面擁有豐富的經(jīng)驗,我曾經(jīng)在大大小小不同的公司工作過,英特爾這點(diǎn)讓我印象非常深刻,英特爾有迄今為止我見過的最佳的后硅培養(yǎng)(post-silicon bring-up)和架構(gòu)分析。出品芯片,我們有數(shù)百個系統(tǒng)同時運(yùn)行。


而且,同事們夜以繼日協(xié)同工作,不僅僅來自Nervana的員工,6個月前剛加入的員工也是如此。當(dāng)然讓數(shù)以百計的員工朝著同一個愿景工作是很困難的,但英特爾是我所經(jīng)歷過的做的更好的一家公司。


問:什么是Lake Crest編程模型?它與GPU相似嗎?


Carey不是的,從高層面看,任何加速器都是一樣的,你有一個為特定的圖層編寫的內(nèi)核,將內(nèi)核放在設(shè)備里,然后將數(shù)據(jù)存儲在設(shè)備上,這就可以了。


所以從這個角度來看,它們都非常相似,在較低層面上,Lake CrestCrest家族一般都沒有共享的二級緩存,它具有軟件控制的內(nèi)存,因此軟件工程師或者內(nèi)核開發(fā)工程師可以控制內(nèi)存中的內(nèi)容,控制其在內(nèi)存中保留的時間,控制從處理元件到處理元件的內(nèi)容,從芯片到芯片的內(nèi)容,它是靜態(tài)的,你無需處理緩存沖突等。


讓這成為可能的是,在深度學(xué)習(xí)中,你能提前知道所有的操作,內(nèi)核開發(fā)工程師能更輕松地保留數(shù)據(jù),移動數(shù)據(jù)和優(yōu)化性能,我們可以這樣做,因為我們不需要做隨機(jī)指示,我可以提前知道指示。


而這一切對數(shù)據(jù)科學(xué)家來說都是隱藏的,數(shù)據(jù)科學(xué)家從來不想圍繞GPU編碼,他們只是想要高速度,而Nervana GPU內(nèi)核就是這樣提供的,我們擁有世界上最快的GPU內(nèi)核,我們擁有與某些客戶合作的FT16內(nèi)核,這也是Nervana比硬件更為出名的地方,硬件實際上并沒有被討論,這些高速內(nèi)核使數(shù)據(jù)科學(xué)家能夠從當(dāng)時的硬件中獲取最多的內(nèi)容,而無需被低水平細(xì)節(jié)所打擾,這是一種很好的模式,因為可以在不同的產(chǎn)品中改變計算機(jī)結(jié)構(gòu),并且由于除了位于英特爾的專門核心團(tuán)隊外,沒有人直接在硬件上編寫代碼,我們可以管理這一更改并且始終盡可能優(yōu)化硬件,可以添加說明,可以添加函數(shù),可以改變事物的工作方式,可以在不影響數(shù)據(jù)科學(xué)的情況下更改bfloat。


| 積極應(yīng)對行業(yè)變化 新芯片明年上市


問:數(shù)據(jù)科學(xué)家本身不關(guān)注硬件?


Carey沒錯,我不認(rèn)為數(shù)據(jù)科學(xué)家真正關(guān)心的是底層的問題,他們只是希望它速度很快,他們不會在乎法拉利是電動的還是混合動力的,是V12還是四缸發(fā)動機(jī) 他們只想在三秒鐘內(nèi)看到它從060。


問:nGraphCUDA相比的優(yōu)勢是什么?


CareynGraphCUDA還是不一樣的,CUDA你可以理解為 nGraph的底面,我們稱之為變壓器,nGraph通過一個固定的API接收來自TensorFlow、CaffeMXNet的輸入,然后通過圖形編譯器進(jìn)行性能優(yōu)化,排除一些不需要的東西,然后將其發(fā)送給CPUMKL-DNN,所以CPU仍然使用MKL-DNN,即使在nGraph中也是如此,相似的,我們也需要為Crest的變壓器,我們也需要一個英特爾其他硬件的變壓器。


問:目前是否有關(guān)于Spring Crest的速度有多快的數(shù)據(jù)或基準(zhǔn)?


Carey我們暫時沒有公布具體數(shù)字,與Lake Crest相比,在性能上有3-4倍的提升,基于我們用客戶提供的Lake Crest反饋,我們在整個設(shè)計過程中提高了性能。


問:有人認(rèn)為我們正處于部署算法的早期,你對算法的潛在變化有什么看法?


Carey我認(rèn)為算法和硬件之間有一點(diǎn)共生關(guān)系,反之亦然。


如果你往回看,過去的幾年,在GPU上的GEMM核心會很快,因此當(dāng)時所有的深度學(xué)習(xí)都指出如何利用GEMM核心來進(jìn)行工作,因為這也是GPU僅有可以很快進(jìn)行處理的地方,如今,GPU上有很多新的核心,數(shù)據(jù)科學(xué)家指出許多新的寫入核心,我們的硬件處于兩者之間,它并沒有完全固定的函數(shù),我們的硬件處理各種各樣的激勵函數(shù),通過bfloat處理各種浮點(diǎn)運(yùn)算,并且我們控制設(shè)備執(zhí)行超出當(dāng)前浮點(diǎn)范圍的事情,你的GEMM,你的卷積神經(jīng),將會得到超級優(yōu)化,我們不會像其他競爭對手一樣擁有固定的函數(shù),我們不會像GPU一樣為了通用用途,我認(rèn)為我們處于一個良好的中間點(diǎn),在未來的幾年也不會過時,隨著時間的推移,我們將增加更多的通用硬件,以處理更多的混合工作負(fù)載。


問:你們是如何制定AI路線圖的?背后有哪些考慮?


Carey我們的路線圖與任何人的路線圖都相似:每年更大,更強(qiáng),更快。


我們每年都會進(jìn)行增量架構(gòu)更改以提升性能,行業(yè)中出現(xiàn)的任何新事物如果與我們的硬件產(chǎn)品組合相關(guān),我們會采取行動。(完)


注:《AI英雄》人物專訪隸屬網(wǎng)易智能工作室,與行業(yè)人士一起洞察技術(shù)趨勢,捕捉行業(yè)機(jī)會。轉(zhuǎn)載請注明出處,違者必究!


關(guān)鍵字:英特爾 引用地址:對話英特爾AI硬件負(fù)責(zé)人:什么是真正的AI芯片

上一篇:Entegris 上海開建中國技術(shù)中心,助力中國半導(dǎo)體制造商加速建成投產(chǎn)
下一篇:ST高速、高分辨率電機(jī)驅(qū)動板,使開源3D打印機(jī)性能最大化

推薦閱讀

環(huán)境:主機(jī):WINXP開發(fā)環(huán)境:MDK4.23MCU:STM32F103CBT6說明:串口可以配置成用DMA的方式接收數(shù)據(jù),不過DMA需要定長才能產(chǎn)生接收中斷,如何接收可變長度的數(shù)據(jù)呢?方法有以下3種:1.將RX腳與一路時鐘外部引腳相連,當(dāng)串口一幀發(fā)完,即可利用此定時器產(chǎn)生超時中斷.這個實時性較高,可以做到1個字節(jié)實時監(jiān)測.2.不改變硬件,開啟一個定時器監(jiān)控DMA接收,如果超時則產(chǎn)生中斷...
據(jù)外媒報道,弗勞恩霍夫研究人員開發(fā)了一種新的照明技術(shù),不僅超越了法律和汽車工業(yè)對照明性能和功能的要求,同時比目前的系統(tǒng)更有效、更緊湊、而且安裝位置更靈活。新開發(fā)的車燈能讓設(shè)計師更自由地設(shè)計非傳統(tǒng)風(fēng)格的汽車,同時也使駕駛員和汽車制造商從中受益。(圖片來源:弗勞恩霍夫官網(wǎng))弗勞恩霍夫國際光學(xué)研究所(IOF)的科學(xué)家們將展示一個分段遠(yuǎn)光...
本周正值5G商用一周年之際,這一年來,5G網(wǎng)絡(luò)部署快馬加鞭,5G手機(jī)也快速涌向市場,并下探至“千元機(jī)”。不過,今年在疫情的影響下,整個移動終端產(chǎn)品銷量并不樂觀,而隨著消費(fèi)類市場逐步回暖,以TWS耳機(jī)和可穿戴手表市場帶動產(chǎn)業(yè)鏈迎來新拐點(diǎn)。與此同時,本周內(nèi)半導(dǎo)體及手機(jī)產(chǎn)業(yè)鏈企業(yè)登陸資本市場的熱情不減,集微網(wǎng)對擬上市進(jìn)行深度剖析,陸續(xù)推出“IPO...
業(yè)內(nèi)人士周二透露稱,三星顯示有望在今年下半年生產(chǎn)下一代面板。韓聯(lián)社援引消息人士話稱,三星顯示將于本月發(fā)布用于電視和監(jiān)視器的量子點(diǎn)(QD)面板的試產(chǎn)產(chǎn)品,并會將其發(fā)給客戶做進(jìn)一步測試。三星顯示早些時候透露,該公司計劃在今年下半年如期推出QD 面板。據(jù)了解,新面板采用了三星的自發(fā)光量子點(diǎn)技術(shù)。三星在 2019 年 10 月宣布投資 QD 面板生...

史海拾趣

問答坊 | AI 解惑

識別內(nèi)存編號

識別內(nèi)存編號 內(nèi)存作假主要是以低速內(nèi)存冒充高速度的,以低容量內(nèi)存冒充高容量的。要杜絕此類作假,就要學(xué)會識別內(nèi)存規(guī)格和內(nèi)存芯片編號,方法一般是看SPD芯片中的信息和內(nèi)存芯片上的編號,前者是內(nèi)存的技術(shù)規(guī)范,后者由于廠家的不同,其編 ...…

查看全部問答∨

AVR學(xué)習(xí)筆記已經(jīng)更新到第二十四篇了,論壇首頁也改一下,呵呵

AVR學(xué)習(xí)筆記已經(jīng)更新到第二十四篇了,論壇首頁也改一下,呵呵 論壇首頁還是寫的共21篇,是不是該改一下了, 嘿嘿,要求如果過分,請不要介意…

查看全部問答∨

給大家分享個溫濕度傳感器SHT21中文資料及代碼

產(chǎn)品類別:濕度傳感器 產(chǎn)品型號:SHT21 產(chǎn)品特點(diǎn): SHT2 ...…

查看全部問答∨

SQL CE2.0同時只能有一個連接嗎?

在wince 5.0環(huán)境下,用EVC寫的應(yīng)用程序,連接SQL CE2.0數(shù)據(jù)庫,當(dāng)打開2個程序同時去連接數(shù)據(jù)庫時就會出錯,請問如何解決?急著等。。。。。…

查看全部問答∨

關(guān)于MAX7219控制數(shù)碼管顯示問題(MCU:C8051F340) ??

我的程序不知道哪里有錯誤,請大俠幫忙看一下,意見多多益善。 這個程序是用來顯示123456 六位數(shù)。 #include        #define        Decoding        0x09 #define    ...…

查看全部問答∨

EVC上控件顯示的問題!

    各位老大 這個問題很菜,在控件上用了Gruopbox以后,Gruopbox里包含的控件都不能顯示了,比如按鈕之類的,這是啥原因???去掉Gruopbox就可以了,請各位指教!…

查看全部問答∨

使用BenQ M23 GPRS模塊撥號指令遇到的問題

BENQ M23 撥號上網(wǎng)遇到的問題 執(zhí)行的指令如下: AT+CGDCONT=1,\"IP\",\"CMNET\" OK AT%CGPCO=1,\"PAP,,\",1 OK AT$DESTINFO=\"211.103.040.171\",1,9002 $DESTINFO:3\", 1, …

查看全部問答∨

請幫忙看看第三個"火"是哪個溫度

我PC上四個風(fēng)扇,電源,cpu,主板,顯卡,我每次用speed fan 這個軟件測,一開機(jī)就90幾度,夏天打魔獸一會就跑到100度,如果把空調(diào)開到很低也就是90幾度,好象也沒有什么大的影響,,就是覺得怪嚇人的,,還搞不清楚到底是哪個溫度這么高,從 ...…

查看全部問答∨

急?。?!請教大家一個模擬器連接設(shè)置的問題

我安裝了EVC4和補(bǔ)丁EVC4SP4,再安裝了一個自己的模擬器。但是在連接的時候,EVC老連接不上模擬器,但是EVC自帶的標(biāo)準(zhǔn)模擬器又可以連接上。請問大家知道是什么原因嗎?我設(shè)置和重裝了很多次,都不行。謝謝大家了!一定會及時結(jié)帖給分!…

查看全部問答∨
小廣播
最新嵌入式文章

 
EEWorld訂閱號

 
EEWorld服務(wù)號

 
汽車開發(fā)圈

 
機(jī)器人開發(fā)圈

電子工程世界版權(quán)所有 京ICP證060456號 京ICP備10001474號-1 電信業(yè)務(wù)審批[2006]字第258號函 京公網(wǎng)安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved