Kāda ir labākā grafikas karte dziļai mācībai?

Ja centrālais procesors ir datora smadzenes, tad GPU ir dvēsele. Lai gan lielākā daļa datoru var darboties bez laba GPU, dziļa mācīšanās nav iespējama bez tā. Tas ir tāpēc, ka dziļa mācīšanās prasa sarežģītas darbības, piemēram, manipulācijas ar matricu, ārkārtas skaitļošanas priekšnoteikumus un ievērojamu skaitļošanas jaudu.

Pieredze ir būtiska, lai attīstītu prasmes, kas nepieciešamas, lai dziļi mācītos jaunos jautājumos. Ātrs GPU nozīmē ātru praktiskās pieredzes iegūšanu, izmantojot tūlītēju atgriezenisko saiti. GPU satur vairākus kodolus, lai veiktu paralēlus aprēķinus. Tajos ietilpst arī plašs atmiņas joslas platums, lai šo informāciju varētu ērti pārvaldīt.

Mūsu labākais ieteicamais labākais grafikas karte dziļai mācībai ir Nvidia Geforce RTX 2080 Founders Edition. Pērciet to tagad par USD 1940 USD Amazon

Paturot to prātā, mēs cenšamies atbildēt uz jautājumu: “Kāda ir labākā grafiskā karte AI, mašīnmācībai un padziļinātai apmācībai?”, Pārskatot vairākas grafikas kartes, kas pašlaik ir pieejamas 2021. gadā. Pārskatītās kartes:

AMD RX Vega 64

NVIDIA Tesla V100

Nvidia Quadro RTX 8000

GeForce RTX 2080 Ti

NVIDIA Titan RTX

Zemāk ir rezultāti:

AMD RX Vega 64

Radeon RX Vega 64

Iespējas

Izlaiduma datums: 2017. gada 14. augusts
Vega arhitektūra
PCI Express saskarne
Pulksteņa ātrums: 1247 MHz
Straumes procesori: 4096
VRAM: 8 GB
Atmiņas joslas platums: 484 GB / s

Pārskatīšana

Ja jums nepatīk NVIDIA GPU vai jūsu budžets neļauj tērēt grafikas kartei vairāk nekā 500 ASV dolāru, AMD ir gudra alternatīva. AMD RS Vega 64 ir pietiekami daudz atmiņas, ātrs atmiņas joslas platums un vairāk nekā pietiekami straumēšanas procesoru.

Vega arhitektūra ir jauninājums no iepriekšējām RX kartēm. Veiktspējas ziņā šis modelis ir tuvu GeForce RTX 1080 Ti, jo abiem šiem modeļiem ir līdzīgs VRAM. Turklāt Vega atbalsta vietējo pusprecizitāti (FP16). ROCm un TensorFlow darbojas, taču programmatūra nav tik nobriedusi kā NVIDIA videokartēs.

Kopumā Vega 64 ir pienācīgs GPU dziļām mācībām un AI. Šis modelis maksā krietni zem USD 500 USD, un tas tiek paveikts iesācējiem. Tomēr profesionālām lietojumprogrammām ieteicams izvēlēties NVIDIA karti.

AMD RX Vega 64 Sīkāka informācija: Amazon

NVIDIA Tesla V100

Tesla V100

Iespējas:

Izlaiduma datums: 2017. gada 7. decembris
NVIDIA Volta arhitektūra
PCI-E saskarne
112 TFLOPS tenzora veiktspēja
640 Tensora serdeņi
5120 NVIDIA CUDA® serdeņi
VRAM: 16 GB
Atmiņas joslas platums: 900 GB / s
Aprēķināt API: CUDA, DirectCompute, OpenCL ™, OpenACC®

Pārskats:

NVIDIA Tesla V100 ir behemots un viena no labākajām grafikas kartēm AI, mašīnmācībai un dziļām mācībām. Šī karte ir pilnībā optimizēta, un tajā ir iesaiņoti visi labumi, kas var būt nepieciešami šim nolūkam.

Tesla V100 ir 16 GB un 32 GB atmiņas konfigurācijās. Ar lielu VRAM, AI paātrinājumu, lielu atmiņas joslas platumu un specializētiem tenzora kodoliem dziļai mācībai varat būt drošs, ka katrs jūsu apmācības modelis darbosies nevainojami - un mazāk laika. Konkrēti, Tesla V100 var nodrošināt 125TFLOPS dziļas mācīšanās veiktspējas gan apmācībai, gan secinājumiem [3], ko nodrošina NVIDIA Volta arhitektūra.

NVIDIA Tesla V100 Sīkāka informācija: Amazon, (1)

Nvidia Quadro RTX 8000

Nvidia Quadro Rtx 8000

Iespējas:

Izlaiduma datums: 2018. gada augusts
Turingas arhitektūra
576 tenzora serdeņi
CUDA serdeņi: 4 608
VRAM: 48 GB
Atmiņas joslas platums: 672 GB / s
16.3 TFLOPS
Sistēmas saskarne: PCI-Express

Pārskats:

Quadro RTX 8000 ir īpaši izstrādāts dziļu matricu aritmētikai un aprēķiniem, un tā ir visaugstākā grafiskā karte. Tā kā šai kartei ir liela VRAM ietilpība (48 GB), šo modeli ieteicams izmantot īpaši lielu skaitļošanas modeļu izpētei. Lietojot pārī ar NVLink, jaudu var palielināt līdz pat 96 GB VRAM. Kas ir daudz!

72 RT un 576 Tensor kodolu kombinācija uzlabotai darbplūsmai nodrošina vairāk nekā 130 TFLOPS veiktspēju. Salīdzinot ar visdārgāko grafikas karti mūsu sarakstā - Tesla V100 - šis modelis potenciāli piedāvā par 50 procentiem vairāk atmiņas un joprojām izdodas maksāt mazāk. Pat uzstādītajā atmiņā šim modelim ir izcila veiktspēja, vienlaikus strādājot ar lielākiem partijas izmēriem vienā GPU.

Atkal, tāpat kā Tesla V100, šo modeli ierobežo tikai jūsu cenas jumts. Tas nozīmē, ka, ja vēlaties ieguldīt nākotnē un augstas kvalitātes skaitļošanā, iegūstiet RTX 8000. Kas zina, jūs varat vadīt AI pētījumus. Tesla V100 pamatā ir Turingas arhitektūra, kur V100 ir balstīta uz Volta arhitektūru, tāpēc Nvidia Quadro RTX 8000 var uzskatīt par nedaudz modernāku un nedaudz jaudīgāku nekā V100.

Nvidia Quadro RTX 8000 Sīkāka informācija: Amazon

GeForce RTX 2080 Ti

Geforce RTX 2080 dibinātāju izdevums

Iespējas:

Izlaiduma datums: 2018. gada 20. septembris
Turing GPU arhitektūra un RTX platforma
Pulksteņa ātrums: 1350 MHz
CUDA serdeņi: 4352
11 GB nākamās paaudzes, īpaši ātra GDDR6 atmiņa
Atmiņas joslas platums: 616 GB / s
Jauda: 260W

Pārskats:

GeForce RTX 2080 Ti ir budžeta opcija, kas ideāli piemērota neliela apjoma modelēšanai, nevis liela mēroga apmācībai. Tas ir tāpēc, ka tai ir mazāka GPU atmiņa vienā kartē (tikai 11 GB). Šī modeļa ierobežojumi kļūst acīmredzamāki, apmācot dažus mūsdienu NLP modeļus. Tomēr tas nenozīmē, ka šī karte nevar konkurēt. RTX 2080 pūtēja konstrukcija ļauj veikt daudz blīvākas sistēmas konfigurācijas - līdz pat četriem GPU vienā darbstacijā. Turklāt šis modelis neironu tīklus trenē ar 80 procentiem ātrumu Tesla V100. Saskaņā ar LambdaLabs dziļo mācību veiktspējas kritērijiem, salīdzinot ar Tesla V100, RTX 2080 ir 73% FP2 ātrums un 55% FP16 ātrums.

Tikmēr šis modelis maksā gandrīz 7 reizes mazāk nekā Tesla V100. Gan no cenas, gan veiktspējas viedokļa GeForce RTX 2080 Ti ir lielisks GPU dziļām mācībām un AI attīstībai.

GeForce RTX 2080 Ti Sīkāka informācija: Amazon

NVIDIA Titan RTX

NVIDIA Titan RTX grafika

Iespējas:

Izlaiduma datums: 2018. gada 18. decembris
Darbina ar NVIDIA Turing ™ arhitektūru, kas paredzēta AI
576 tenzora serdeņi AI paātrināšanai
130 teraFLOPS (TFLOPS) dziļas apmācības apmācībai
CUDA serdeņi: 4608
VRAM: 24 GB
Atmiņas joslas platums: 672 GB / s
Ieteicamais barošanas avots 650 vati

Pārskats:

NVIDIA Titan RTX ir vēl viens vidēja līmeņa GPU, ko izmanto sarežģītām dziļu mācību operācijām. Šī modeļa 24 GB VRAM ir pietiekami, lai strādātu ar lielāko daļu sēriju. Tomēr, ja vēlaties apmācīt lielākus modeļus, savienojiet šo karti ar NVLink tiltu, lai faktiski būtu 48 GB VRAM. Šī summa būtu pietiekama pat lieliem transformatoru NLP modeļiem. Turklāt Titan RTX ļauj veikt pilnas klases jauktas precizitātes apmācību modeļiem (t.i.e., FP 16 kopā ar FP32 uzkrāšanos). Rezultātā šis modelis darbojas aptuveni par 15 līdz 20 procentiem ātrāk darbībās, kurās tiek izmantoti Tensor serdeņi.

Viens no NVIDIA Titan RTX ierobežojumiem ir divu ventilatoru dizains. Tas kavē sarežģītākas sistēmas konfigurācijas, jo to nevar ievietot darbstacijā bez būtiskām dzesēšanas mehānisma izmaiņām, kas nav ieteicams.

Kopumā Titan ir lielisks, universāls GPU gandrīz jebkura dziļa mācību uzdevuma izpildei. Salīdzinot ar citām vispārējas nozīmes grafiskajām kartēm, tas noteikti ir dārgs. Tāpēc šis modelis nav ieteicams spēlētājiem. Neskatoties uz to, pētnieki, iespējams, novērtēs papildu VRAM un veiktspējas palielināšanu, izmantojot sarežģītus dziļas mācīšanās modeļus. Titan RTX cena ir ievērojami mazāka nekā iepriekš demonstrētā V100, un tā būtu laba izvēle, ja jūsu budžets neļauj V100 cenām veikt dziļu mācīšanos vai jūsu darba slodzei nav vajadzīgs vairāk nekā Titan RTX (skatiet interesantos etalonus)

NVIDIA Titan RTX Sīkāka informācija: Amazon

Labākās grafikas kartes izvēle AI, mašīnmācībai un dziļai mācīšanai

AI, mašīnmācīšanās un dziļu mācību uzdevumi apstrādā datu kaudzes. Šie uzdevumi var būt ļoti sarežģīti jūsu aparatūrai. Zemāk ir funkcijas, kas jāpatur prātā pirms GPU iegādes.

Serdes

Kā vienkāršs īkšķis, jo lielāks serdeņu skaits, jo augstāka būs jūsu sistēmas veiktspēja. Jāņem vērā arī serdeņu skaits, īpaši, ja jums ir darīšana ar lielu datu apjomu. NVIDIA ir nosaukusi savus serdeņus par CUDA, savukārt AMD to kodolus sauc par straumes procesoriem. Izvēlieties vislielāko apstrādes kodolu skaitu, ko atļauts jūsu budžets.

Apstrādes jauda

GPU apstrādes jauda ir atkarīga no serdeņu skaita sistēmā, kas reizināts ar pulksteņa ātrumiem, ar kuriem jūs darbināt kodolus. Jo lielāks ātrums un lielāks kodolu skaits, jo lielāka būs apstrādes jauda, ar kādu jūsu GPU var aprēķināt datus. Tas arī nosaka, cik ātri jūsu sistēma veiks uzdevumu.

VRAM

Video RAM jeb VRAM ir datu apjoma mērījums, ko jūsu sistēma var apstrādāt vienlaikus. Augstāks VRAM ir vitāli svarīgs, ja strādājat ar dažādiem Computer Vision modeļiem vai veicat kādas CV Kaggle sacensības. VRAM nav tik svarīgs NLP vai darbam ar citiem kategoriskiem datiem.

Atmiņas joslas platums

Atmiņas joslas platums ir ātrums, kādā dati tiek nolasīti vai saglabāti atmiņā. Vienkārši sakot, tas ir VRAM ātrums. Mērot GB / s, lielāks atmiņas joslas platums nozīmē, ka karte var iegūt vairāk datu īsākā laikā, kas nozīmē ātrāku darbību.

Atdzesēšana

GPU temperatūra var būt ievērojams trūkums, kad runa ir par veiktspēju. Mūsdienu grafiskie procesori maksimāli palielina ātrumu, vienlaikus darbinot algoritmu. Bet tiklīdz ir sasniegts noteikts temperatūras slieksnis, GPU samazina apstrādes ātrumu, lai pasargātu no pārkaršanas.

Ventilatora ventilatora konstrukcija gaisa dzesētājiem izstumj gaisu ārpus sistēmas, kamēr ventilatori, kas nav ventilatori, iesūc gaisu. Arhitektūrā, kur vairāki GPU atrodas blakus viens otram, ventilatori, kas nav pūtēji, sildīs vairāk. Ja gaisa dzesēšanu izmantojat iestatījumā ar 3 līdz 4 GPU, izvairieties no ventilatoriem, kas nav ventilatori.

Ūdens dzesēšana ir vēl viena iespēja. Lai arī tā ir dārga, šī metode ir daudz klusāka un nodrošina, ka pat visveiksmīgākie GPU iestatījumi visā darbības laikā paliek vēsi.

Secinājums

Lielākajai daļai lietotāju, kas sāk mācīties dziļi, RTX 2080 Ti vai Titan RTX nodrošinās vislielāko triecienu. Vienīgais RTX 2080 Ti trūkums ir ierobežots 11 GB VRAM izmērs. Apmācība ar lielākiem partijas izmēriem ļauj modeļiem trenēties ātrāk un daudz precīzāk, ietaupot daudz lietotāja laika. Tas ir iespējams tikai tad, ja jums ir Quadro GPU vai TITAN RTX. Pusprecizitātes (FP16) izmantošana ļauj modeļiem iekļauties GPU ar nepietiekamu VRAM izmēru [2]. Progresīvākiem lietotājiem Tesla V100 ir vieta, kur jums vajadzētu ieguldīt. Tā ir mūsu labākā izvēle par labāko grafisko karti AI, mašīnmācībai un dziļām mācībām. Tas ir viss šim rakstam. Mēs ceram, ka jums tas patika. Līdz nākamajai reizei!

Atsauces

Labākie GPU AI, mašīnmācībai un padziļinātai mācībai 2020. gadā
Labākais GPU dziļām mācībām 2020. gadā
NVIDIA AI INFERENCE PLATFORM: Milzīgi lēcieni AI pakalpojumu veiktspējā un efektivitātē, sākot no datu centra līdz tīkla malai
NVIDIA V100 TENSOR CORE GPU
Titan RTX dziļu mācību etaloni