顯卡
顯卡,全稱顯示接口卡,又稱顯示適配器,是計(jì)算機(jī)最基本的配件之一,其主要功能是負(fù)責(zé)圖形操作。顯卡主要由GPU芯片、顯存、散熱器、PCB板和接口組成,其中GPU芯片的實(shí)力直接決定了顯卡的整體性能。
顯卡的性能指標(biāo)包括GPU的頻率、流處理器單元的數(shù)量、顯存的容量、位寬和速度等。顯卡根據(jù)應(yīng)用場(chǎng)景不同可分為游戲顯卡、科學(xué)計(jì)算加速卡和渲染專業(yè)卡。
2023年,顯卡GPU芯片的主要制造商是NVIDIA、AMD和英特爾,它們都是美國電子產(chǎn)品開發(fā)公司,致力于各種核心芯片的研發(fā)。NVIDIA生產(chǎn)的顯卡有GeForce RTX、GTX等。,它們被稱為“N卡”;AMD主要開發(fā)鐳龍系列,稱為“a卡”。英特爾主要生產(chǎn)集成顯卡。市場(chǎng)上的高端顯卡主要在游戲體驗(yàn)、畫面輸出和使用流暢度等方面進(jìn)行技術(shù)創(chuàng)新和迭代。
隨著計(jì)算機(jī)領(lǐng)域進(jìn)入統(tǒng)一渲染架構(gòu)時(shí)代,顯卡的重要性凸顯。并且對(duì)架構(gòu)進(jìn)行了優(yōu)化,使GPU能夠完成大規(guī)模計(jì)算需求,NVIDIA CUDA技術(shù)進(jìn)一步強(qiáng)化了這一功能。過去只能使用CPU進(jìn)行計(jì)算的應(yīng)用程序現(xiàn)在可以使用GPU進(jìn)行計(jì)算,大大減輕了CPU的負(fù)擔(dān)。
發(fā)展歷史
早期發(fā)展
在微型計(jì)算機(jī)發(fā)展的早期,還沒有顯卡的概念,而是要顯示的信息由CPU計(jì)算并輸出到主板上由幾個(gè)集成電路塊組成的顯示單元,然后轉(zhuǎn)換成顯示器可以識(shí)別的信號(hào)進(jìn)行輸出顯示。但是,這種顯示設(shè)備只能完成一些基本的顯示功能。
真正顯卡的誕生還要?dú)w功于新的顯示模式的出現(xiàn),因?yàn)樵赩GA標(biāo)準(zhǔn)出現(xiàn)之前,顯示器支持的最大顏色數(shù)量只有8到16種,因此計(jì)算機(jī)系統(tǒng)和顯示系統(tǒng)之間幾乎沒有需要處理的數(shù)據(jù),色調(diào)也非常簡(jiǎn)單。然而,在VGA標(biāo)準(zhǔn)被采用后,盡管可用的顏色數(shù)量也是8到16種,但在模擬電路中,每種顏色可以用64種不同的亮度來表示。因此,系統(tǒng)支持的顏色數(shù)量已經(jīng)達(dá)到了262,144和6,777,216種,也就是我們通常所說的256和24位顏色。這時(shí),計(jì)算機(jī)設(shè)計(jì)師將具有顯示功能的單元從主板上分離出來,并將其制作成專用顯卡。但此時(shí)顯卡體積龐大,功能單一,受接口限制速度較慢,但與板上的顯示單元相比已經(jīng)有了很大的進(jìn)步。
開發(fā)期
顯卡與主板分離后,與系統(tǒng)的數(shù)據(jù)傳輸主要依靠ISA和EISA總線接口。這時(shí)的顯卡叫ISA顯卡。然而,隨著CPU頻率的快速增長(zhǎng)和計(jì)算機(jī)制造技術(shù)的發(fā)展,ISA總線的傳輸速度已成為限制顯卡速度的瓶頸。隨著PCI總線結(jié)構(gòu)的出現(xiàn),這一瓶頸已被突破。PCI總線速度最高傳輸速率可達(dá)132MB/S,顯存容量也大大增加。此時(shí)顯卡的顯示效果和運(yùn)行速度都得到了很大的提升。
但是,PCI顯卡本身也有很大的缺陷。當(dāng)要顯示的畫面質(zhì)量過高,需要處理的數(shù)據(jù)過多時(shí),就會(huì)出現(xiàn)停頓現(xiàn)象。對(duì)于要求更高的游戲來說,PCI顯卡也暴露了它的缺點(diǎn)。這時(shí),在英特爾的倡導(dǎo)下,AGP作為一種新型的顯卡專用接口出現(xiàn)了。AGP采用DIME(直接內(nèi)存訪問),通過一個(gè)“額外接口”使顯卡的核心芯片直接同步訪問內(nèi)存,這樣AGP顯卡就可以與CPU同步獨(dú)立運(yùn)行,比PCI更快。隨著AGP速度的發(fā)展,AGP顯卡可分為AGP1X、AGP2X和AGP4X。雖然PCI和AGP的帶寬是32位,但由于頻率提高到66MHz,AGP的傳輸速率可以達(dá)到266MB/S。然而,2X模式AGP的工作頻率與1X模式一樣保持在66MHz,但利用上升沿和下降沿在一個(gè)頻率周期內(nèi)觸發(fā)兩次,因此傳輸帶寬再次翻倍,達(dá)到532 MB/s .至于AGP 4X模式,每個(gè)頻率周期內(nèi)可傳輸?shù)臄?shù)據(jù)寬度為16字節(jié),最高傳輸帶寬的理論值可達(dá)到1 GB/s以上
在這一系列技術(shù)的影響下。2000年,NVIDIA發(fā)布了具有歷史意義的Geforce 2系列,其中包括眾所周知的Geforce 2MX,它完美地取代了TNT2顯卡,Geforce2MA400幾乎是每個(gè)cs玩家的標(biāo)配。然而,此時(shí)AMD和NVIDIA正在爭(zhēng)奪霸權(quán)。2009年,AMD發(fā)布了最強(qiáng)的單核顯卡HD5870,大幅領(lǐng)先于NVIDIA最強(qiáng)的單核顯卡GTX 285,甚至與小型雙核核彈GTX295打得你死我活。隨后的HD9570更容易受到NVIDIA的攻擊。因此,NVIDIA首席執(zhí)行官黃仁勛開始打磨2010年3月發(fā)布的下一代GTX 480。玩家發(fā)現(xiàn)這一代旗艦GTX 480為了性能犧牲了功耗,并以接近500 W的全功耗壓制了大核的HD5000系列
2012年,NVIDIA歷史性的開普勒架構(gòu)誕生,代表顯卡是GTX 680。升級(jí)到28納米技術(shù)的開普勒架構(gòu)使顯卡的核心頻率首次超過1GHz,與GTX 580相比,性能提高了50W,功耗降低了50W。自這一代開普勒芯片發(fā)布以來,NVIDIA的發(fā)展速度超過了對(duì)手。
2013年底,NVIDIA發(fā)布了基于開普勒架構(gòu)的GTX 700系列顯卡,其中最引人注目的是GTX 780Ti,其性能超過了AMD的旗艦產(chǎn)品R9 290X,功耗降低了30W。英偉達(dá)火爐的帽子也被扔給了AMD。也是從這一代開始,NVIDIA開始銷售名為TITAN的特殊顯卡,面向頂級(jí)游戲玩家和研究人員。
NVIDIA下一代顯卡GTX 900系列采用Maxwell架構(gòu),升級(jí)的重點(diǎn)仍然是提高能耗比。NVIDIA發(fā)現(xiàn)上一代開普勒架構(gòu)削減了太多邏輯控制單元,導(dǎo)致CUDA冗余利用率低。這一代側(cè)重于優(yōu)化CUDA單元的分組。與GTX 780相比,第一代GTX 980的性能提高了30%以上,但功耗降低了10%。當(dāng)時(shí),由于CPU的故障,AMD沒有資金維持新架構(gòu)顯卡的研發(fā),因此只能在原有的GCN架構(gòu)上縫縫補(bǔ)補(bǔ)。直到RYZEN系列處理器的成功,采用RDNA架構(gòu)的RX系列顯卡才得以推出。
但此時(shí),NVIDIA已經(jīng)開發(fā)了新的Pascal架構(gòu)。依靠新的Pascal架構(gòu)和臺(tái)積電的16納米技術(shù),GTX 10系列顯卡的性能提高了60%。再加上當(dāng)時(shí)的采礦潮和AMD顯卡的缺乏,GTX 1060誕生了。
在Pascal的顯卡架構(gòu)徹底擊敗AMD之后,NVIDIA仍然不滿意。2018年,圖靈架構(gòu)顯卡發(fā)布。這一代顯卡最大的特點(diǎn)是增加了RT core和Tenser core,支持光線追蹤和超分辨率采樣技術(shù)。
如今,采用安培架構(gòu)的RTX 3000系列顯卡將光線追蹤和DLSS推向了新的高潮,前三款顯卡RTX 3070、RTX 3080和RTX 3090的性能大幅提升。這時(shí),AMD已經(jīng)被NVIDIA甩得太遠(yuǎn)了。NVIDIA中的光線追蹤已經(jīng)迭代了兩次,在DLSS2.0技術(shù)的加持下,它的可用性很高。AMD近年推出的navi顯卡未能沖擊高端,此后再無大動(dòng)作。
組成結(jié)構(gòu)
獨(dú)立顯卡
獨(dú)立顯卡的組件有:GPU芯片、顯存、散熱器、PCB板、接口、顯卡背板和圓頂。
GPU芯片:即圖形處理器,芯片的實(shí)力直接決定了顯卡的整體性能,而影響GPU芯片性能的主要參數(shù)有GPU架構(gòu)、制造工藝、GPU芯片頻率、流處理器單元SP、紋理單元和光柵單元。
顯存:負(fù)責(zé)存儲(chǔ)顯示芯片需要處理的各種數(shù)據(jù)。主流顯存容量一般為6 GB-8 GB。目前消費(fèi)級(jí)顯存已經(jīng)達(dá)到24GB,專業(yè)級(jí)顯存更大。目前常見的顯存類型有GDDR6和GDDR6X,顯存的帶寬和容量會(huì)影響顯示效果。
散熱器:GPU芯片和內(nèi)存顆粒極易發(fā)熱,溫度過高會(huì)降低頻率,導(dǎo)致顯卡性能下降,所以顯卡基本上都需要一個(gè)好的散熱器。散熱器一般由銅熱管、鋁散熱片和冷卻風(fēng)扇組成。理論上,溫度可以超過90度。
PCB板:PCB板主要負(fù)責(zé)供電。PCB板的電路越復(fù)雜,層數(shù)就越多。
接口:市場(chǎng)上主要使用PCI Express的圖形接口(ISA EISA VLB MCA等。都是獨(dú)立顯卡使用的接口),中高端顯卡可以支持多片同時(shí)工作,并且可以通過網(wǎng)橋連接。
顯卡背板:主要支撐散熱器(防止散熱器壓彎PCB),阻擋靜電,防止灰塵,這是背板的另一個(gè)重要作用,所以背板其實(shí)是必不可少的部件。
導(dǎo)流罩:對(duì)于帶渦輪風(fēng)扇的散熱器來說,導(dǎo)流罩尤為重要,因?yàn)闇u輪風(fēng)扇是定向的,風(fēng)很大,導(dǎo)流罩是封閉的,加強(qiáng)了風(fēng)道,這種散熱器需要將風(fēng)吹到機(jī)箱外面。
集成顯卡
集成顯卡是指芯片組具有集成的圖形處理芯片,使用該芯片組的主板無需單獨(dú)的顯卡即可完成基本的圖形處理功能,以滿足普通家庭娛樂和商業(yè)應(yīng)用的需求。與獨(dú)立顯卡相比,集成顯卡通常沒有獨(dú)立顯存,而是使用系統(tǒng)主存的一部分作為顯存,具體數(shù)量根據(jù)系統(tǒng)需求自動(dòng)動(dòng)態(tài)調(diào)整。界面也不同。獨(dú)立顯卡在連接顯示器之前需要通過專用接口連接到主板上,而集成顯卡則直接集成在主板上,沒有其他接口,更加簡(jiǎn)潔。
技術(shù)指標(biāo)
核心架構(gòu)
架構(gòu)其實(shí)是影響顯卡性能的最重要指標(biāo),而新一代架構(gòu)的出現(xiàn)通常意味著產(chǎn)品的升級(jí)。你可以這樣理解架構(gòu),它就像整個(gè)顯卡的樞紐,就像城市的道路規(guī)劃一樣。在同一個(gè)城市里,如果道路規(guī)劃得好,交通擁堵的可能性就會(huì)降低,你到達(dá)目的地的時(shí)間也會(huì)縮短。幾乎所有玩家都可以區(qū)分顯卡的核心,因?yàn)镹VIDIA在銷售時(shí)會(huì)以芯片型號(hào)命名顯卡型號(hào),例如RTX 2060和RTX 2070,您一眼就可以知道哪種性能更好。
技術(shù)流程
和CPU一樣,顯卡也有進(jìn)程。目前n卡(NVIDIA)最低制程為8 nm,a卡(AMD)最低制程為7 nm。更小的工藝意味著更低的功耗和發(fā)熱量,因此數(shù)字越小越好。但是,顯卡的整體性能不僅由該值決定。
容量:它指示可以保存多少數(shù)據(jù)。
頻率:在某種程度上,它反映了顯存的速度,而顯存的頻率與顯存的類型有很大關(guān)系。顯存的頻率與顯存的時(shí)鐘周期有關(guān),兩者是倒數(shù)關(guān)系。
位寬:位寬是指一次可以讀入的數(shù)據(jù)量,即顯存和顯示芯片之間的數(shù)據(jù)交換速度。位寬越大,存儲(chǔ)器和顯示芯片之間的數(shù)據(jù)交換就越順暢。
流線處理:流處理器單元的數(shù)量是決定顯卡性能的一個(gè)非常重要的指標(biāo)。它可以執(zhí)行頂點(diǎn)操作和像素操作。在不同場(chǎng)景下,顯卡可以動(dòng)態(tài)分配流處理器的數(shù)量進(jìn)行頂點(diǎn)運(yùn)算和像素運(yùn)算,從而充分利用資源。
產(chǎn)品分類
按市場(chǎng)分類
專業(yè)顯卡:專業(yè)顯卡,常用于工作站,主要用于專業(yè)視覺設(shè)計(jì)和創(chuàng)作。在圖形工作站中,它在某種程度上甚至比CPU更重要。與主要面向游戲、娛樂和辦公市場(chǎng)的消費(fèi)級(jí)顯卡相比,專業(yè)顯卡主要面向三維動(dòng)畫軟件(如3DSMax、Maya、Softimage|3D等。)、渲染軟件(如LightScape、3DSVIZ等。)、CAD軟件(如AutoCAD、Pro/Engineer、Unigraphics、SolidWorks等。)等領(lǐng)域。
獨(dú)立顯卡:獨(dú)立顯卡是將顯示芯片和相關(guān)設(shè)備做成獨(dú)立于電腦主板的板卡,成為專業(yè)的圖像處理硬件設(shè)備。獨(dú)立顯卡不占用系統(tǒng)內(nèi)存,在架構(gòu)、流處理器數(shù)量、核心頻率、顯存和位寬上明顯優(yōu)于集成顯卡。在方便性方面,獨(dú)立顯卡可以拆卸,因此如果顯卡配置較低且更換操作方便快捷,則需要將集成顯卡與主板一起更換。在價(jià)格、功耗和兼容性方面,集成顯卡優(yōu)于獨(dú)立顯卡,集成顯卡集成在CPU中,無法升級(jí),因此不存在所謂的升級(jí)成本。獨(dú)立顯卡雖然性能強(qiáng),但發(fā)熱量和功耗都比較高。
集成顯卡:與獨(dú)立顯卡相比,集成顯卡一般沒有顯存。它依靠系統(tǒng)中的部分內(nèi)存作為主內(nèi)存,具體數(shù)量根據(jù)系統(tǒng)的需要?jiǎng)討B(tài)調(diào)整。一般來說,集中顯示或核顯的性能遠(yuǎn)遠(yuǎn)不如獨(dú)立顯卡。只有一些高端核顯可以與入門級(jí)獨(dú)立顯卡的性能相提并論,因此集中式顯示器通常不適合用于執(zhí)行3D游戲或精確的圖形操作。
用領(lǐng)域分類
游戲顯卡:游戲顯卡旨在滿足玩家對(duì)高清晰度、高幀率和流暢游戲體驗(yàn)的需求。游戲顯卡通常具有更高的圖形處理能力和更快的渲染速度,以滿足游戲中需要處理的大量圖像和動(dòng)畫數(shù)據(jù)。
專業(yè)顯卡:專業(yè)顯卡旨在滿足專業(yè)圖形應(yīng)用的需求,例如3D建模、渲染、視頻編輯和CAD。專業(yè)顯卡通常具有更高的精度和更寬的色彩空間,以滿足專業(yè)圖形應(yīng)用中對(duì)精細(xì)細(xì)節(jié)和色彩精度的要求。
AI/深度學(xué)習(xí)顯卡:AI顯卡主要用于深度學(xué)習(xí)等高性能計(jì)算任務(wù),需要強(qiáng)大的浮點(diǎn)計(jì)算能力、高速內(nèi)存帶寬、大容量?jī)?nèi)存和優(yōu)化的軟件驅(qū)動(dòng)。游戲卡主要用于圖形渲染等娛樂用途,這需要高頻的核心時(shí)鐘、多樣的輸出接口和良好的散熱設(shè)計(jì)。因此,AI顯卡和游戲卡在硬件架構(gòu)和設(shè)計(jì)上存在很大差異,這導(dǎo)致AI顯卡的成本遠(yuǎn)高于游戲卡。
市場(chǎng)定位分類
這種分類主要針對(duì)消費(fèi)級(jí)獨(dú)立顯卡,包括入門級(jí)顯卡、主流顯卡、高端顯卡和旗艦顯卡。
入門級(jí)顯卡:入門級(jí)獨(dú)立顯示器是一款性能較低的顯卡,定位于觀影和辦公級(jí)別。
主流顯卡:這個(gè)級(jí)別的顯卡也稱為性能級(jí)顯卡,性能強(qiáng)勁,價(jià)格實(shí)惠。
高端顯卡:高端顯卡是指價(jià)格高、性能優(yōu)的顯卡產(chǎn)品,一般面向游戲玩家、設(shè)計(jì)師等對(duì)性能要求較高的用戶。
旗艦顯卡:旗艦顯卡是指這類顯卡在所有顯卡中價(jià)格最高,性能最好。
特征函數(shù)
顯卡除了輸出顯示畫面、保持畫面穩(wěn)定流暢播放等基本功能外,越來越強(qiáng)調(diào)高幀數(shù)和高分辨率。尤其是近年來,為游戲推出的特殊顯卡增加了光線追蹤、DLSS、FSR和XeSS等功能,使玩家在玩游戲時(shí)更具沉浸感。
光線追蹤:光線追蹤是一種計(jì)算視線觀察畫面的路徑,找到反射器和相應(yīng)的光源,然后模擬照明效果的技術(shù)。
DLSS:初衷是超分辨率技術(shù),即通過顯卡渲染一張低分辨率的圖片,然后由AI渲染一張高分辨率的圖片進(jìn)行學(xué)習(xí)。
FSR:FSR用于在相同分辨率和圖像質(zhì)量設(shè)置下提高游戲幀率并改善玩家的游戲體驗(yàn)。
Xess:Xess是一種超級(jí)采樣技術(shù),它使用機(jī)器學(xué)習(xí)將低分辨率幀重建為高分辨率幀,可以在低配置下顯著提高游戲的流暢性。