GK110設(shè)計(jì)師專(zhuān)訪(fǎng):講述70億GPU背后故事
作為GTC 2012大會(huì)的一部分,最后的一天還有個(gè)采訪(fǎng)活動(dòng),接受采訪(fǎng)的是GK110的兩位設(shè)計(jì)師,Jonah albums是GPU工程部門(mén)的高級(jí)副總裁,Danskin則是負(fù)責(zé)GPU架構(gòu)的副總裁。
以下就是Heise網(wǎng)站帶來(lái)的報(bào)道,問(wèn)答形式,內(nèi)容很勁爆,提問(wèn)的一方?jīng)]什么客套,植入主題,回答的一方“太極推手”防守嚴(yán)密,從中能得到多少收獲就看自己的理解了。
Q:GK110性能比GK104強(qiáng)多少?
Albums:我們已經(jīng)公布了GK110的規(guī)格,但是最終的頻率之類(lèi)的還沒(méi)有定,這是項(xiàng)目開(kāi)發(fā)中很自然的事,問(wèn)題是功能單元的數(shù)量還是顯存位寬會(huì)影響產(chǎn)品的性能?基于這些因素,你們可以期待性能提升50%,而SGEMM之類(lèi)對(duì)計(jì)算性能敏感的應(yīng)用中,性能幾乎與功能單元的數(shù)目成正比。(GK110有15組SMX單元,這么說(shuō)性能比8組SMX的GK104可以高出近一倍了?)
Q:也是就說(shuō),GK110的性能優(yōu)勢(shì)在50-70%左右?
Albums:這是一般的情況,如果是在充分利用了Hyper-Q、Dynamic Parallelism以及雙精度運(yùn)算的HPC應(yīng)用中,這個(gè)(性能提升)比列還會(huì)更高。
Q:Kepler開(kāi)發(fā)了多長(zhǎng)時(shí)間了?
Albums:這個(gè)取決于你問(wèn)的是誰(shuí)了。我是在G80架構(gòu)完成之后開(kāi)始Kepler項(xiàng)目的,大約是7年前了,直到三年前NVIDIA才開(kāi)始有大批人手加入這個(gè)團(tuán)隊(duì)的。
Q:為什么GK110架構(gòu)要等到年底才能發(fā)布,比GK104晚了這么久?
Danskin:這個(gè)問(wèn)題很難回答。GK104功能更少,而且主要針對(duì)顯卡而非計(jì)算應(yīng)用,它必須要及時(shí)發(fā)布。另一方面,GK110則是一款大核心架構(gòu),TSMC在流片和制造過(guò)程中要扮演更大的角色。(TSMC又中槍了,不過(guò)這么復(fù)雜的芯片確實(shí)是個(gè)問(wèn)題)
Albums:GK110這樣龐大的芯片不可能在新架構(gòu)的同時(shí)再使用新工藝,還需要等28nm工藝更加成熟。
Q:研發(fā)GK110架構(gòu)最大的挑戰(zhàn)是什么?
Albums:很明顯,就是新開(kāi)發(fā)的Hyper-Q和Dynamic Parallelism技術(shù)。
Danskin:由于GPU需要自動(dòng)刷新線(xiàn)程,Dynamic Parallelism技術(shù)實(shí)際上非常復(fù)雜,Hyper-Q對(duì)有些人很有意義,更容易實(shí)現(xiàn)而且會(huì)帶來(lái)更好的性能。Dynamic Parallelism可以簡(jiǎn)化寫(xiě)代碼的過(guò)程,這在以往是不可能的,對(duì)我們而言它是最重要的功能。
Q:NVIDIA增強(qiáng)了GK110的雙精度浮點(diǎn)性能,它是靠幾個(gè)單精度核心聯(lián)合工作實(shí)現(xiàn)的嗎?
Danskin:GK110有獨(dú)立的雙精度運(yùn)算單元。(昨天PCGH的解析中已經(jīng)明確了這一點(diǎn)。)
Q:這是GK110為什么占用這么多核心的原因?
Ablbums:實(shí)際上(雙精度單元)占用的并不多。主要還是SMX單元增多帶來(lái)的,另一個(gè)占面積較大的功能是ECC校驗(yàn)單元。
Q:GK110的雙精度性能是單精度的1/3,為什么不是1/2?
Danskin:由于架構(gòu)不同,1/2的比列很難實(shí)現(xiàn)。
Albums:簡(jiǎn)單來(lái)說(shuō)那樣做需要更多的資源,我們要重新考慮寄存器之類(lèi)的設(shè)計(jì)。
Danskin:還有就是每瓦性能比的問(wèn)題,我們認(rèn)為目前的(1/3)比列是合適的。
Q:GK110為什么使用384bit位寬而非512bit?
Danskin:使用512bit位寬也會(huì)導(dǎo)致功耗及其他代價(jià)升高,GK110使用384bit位寬則可以在性能和代價(jià)中保持平衡。
Q:目前的GK110只使用了13-14組SMX單元,未來(lái)是否會(huì)有開(kāi)啟完整15組SMX單元的產(chǎn)品?
Albums:某種意義上說(shuō),很有可能。
Q:GK110的硬件編碼單元與GK104有什么提升嗎?
Ablums:GK110的硬件編碼單元跟GK104是一樣的。
Q:你們認(rèn)為未來(lái)的GPU開(kāi)發(fā)最困難的挑戰(zhàn)是什么?
Danskin:最大的挑戰(zhàn)是功耗。回顧一下過(guò)往的歷程,我們以及AMD都是一樣的:更高的性能,更高的功耗?,F(xiàn)在一切都改變了,功耗是明顯的分界線(xiàn)。另外,如以往走過(guò)的相似,先進(jìn)的制造技術(shù)有利于改善(功耗)問(wèn)題。
Albums:主要挑戰(zhàn)還是每瓦性能比,圖形芯片設(shè)計(jì)中這倒是個(gè)次要因素。
更多信息請(qǐng)關(guān)注:21ic網(wǎng)友雜談?lì)l道





