RAID

Dublējums pret RAID

Dublējums pret RAID
Dublējumi ir izšķiroša mūsu digitālās dzīves sastāvdaļa. Katram datoram no milzīgām datu bāzēm līdz vienam personālajam datoram vai mobilajai ierīcei ir nepieciešama rezerves kopija. Vieta, kur visatbilstošākos lietotāja datus var glabāt ilgu laiku, kā arī glabāt tādā veidā, lai tos varētu atgūt nepieciešamības laikā. Mēs varam nošķirt datus par mūsu pašreiz darbojošos sistēmu, sauksim to tiešie dati, un dublēts dati. Pēdējā tiek glabāta prom no pašreizējās sistēmas, kas izmanto reālos datus.

RAID attiecas uz dzīvajiem datiem, tas ir mehānisms, ar kuru darbojas sistēma apvieno vairākus diskus vienā krātuves entītijā. Pēc tam dati tiek izplatīti pa visiem diskiem tā, lai tie varētu izdzīvot vismaz viena (vai vairāku) fizisko disku kļūmes gadījumā. Vienkāršākais RAID masīva veids ir RAID1 jeb spoguļošana. Šeit jūs kopējat (vai spoguļojat) tos pašus datus divos vai vairāk diskos tā, ka, ja kāds no diskiem neizdodas, dati joprojām var izdzīvot un tos joprojām aktīvi izmantot. Ir arī citas RAID konfigurācijas, un mēs tās apspriedīsim, ejot.

Par RAID

RAID jeb Redundant Array of Cheap Cheap Disks ir mehānisms datu glabāšanai visos diskos. Varat izmantot plašu RAID iestatījumu klāstu, taču divi pamatmehānismi, uz kuriem visi balstās, ir šādi:

1. Spoguļošana:

Spoguļošana nozīmē, ka jūsu datu bloki tiek kopēti, atspoguļoti vairākos diskos. Ja spoguļojat datus trijos diskos, jūs jebkurā brīdī varat izdzīvot līdz diviem diska kļūmēm, tad neizdevušos diskus bez īpašām problēmām var aizstāt ar jauniem. Līdzīgi, ja kopējat datus pāri n + 1 diskus, jūs varat izturēt līdz pat n diski neizdodas. Negatīvais ir tas, ka jūs saņemat tikai tādu atmiņas ietilpību, kas vienāda ar mazāko disku jūsu RAID masīvā.

2. Paritāte:

Otra pieeja ir sadalīt datus divās daļās, izmantojot divus lietotāja datu blokus, jūs varat izveidot trešo “paritātes” bloku. Visi trīs bloki ir vienāda izmēra un ir sadalīti dažādās ierīcēs. Lai šī konfigurācija darbotos, ir nepieciešamas vismaz trīs ierīces. Ja kāds no diskiem neizdodas, varat atjaunot tajā saglabātos blokus, izmantojot pārējos divus blokus. Piemēram, ja tiek zaudēts otrais lietotāja bloks, pirmo bloku un paritātes bloku var izmantot, lai aprēķinātu otro lietotāja bloku. Ja jūs interesē, kā tas darbojas, pārbaudiet šo brīnišķīgo skaidrojumu.

Šo metodi var uzlabot, ja tai ir 2 vai pat 3 paritātes bloki. Bet nozarē tik bieži netiek novēroti vairāk nekā 3 paritātes bloki. Ja jums ir viens paritātes bloks, jūs varat izdzīvot vienā diska kļūmē. Divi paritātes bloki nozīmē, ka jūs varat izturēt divu disku kļūmi un tā tālāk.

Krātuves izmantošanas ziņā tā ir efektīvāka nekā spoguļošana. Ja jums ir viens paritātes bloks, jums būs nepieciešama tikai par 50% lielāka fiziskā krātuve katram jūsu glabājamajam lietotāja datiem. Tas nozīmē glabāt 1 GB nepieciešamo datu 1.5 GB krātuve (turklāt metadatiem ir neliela pieskaitāmā summa). Tas ir daudz efektīvāk nekā pat visefektīvākā spoguļošanas shēma, kurā, lai atspoguļotu 1 GB datu starp diviem diskiem, jums ir nepieciešama vismaz 2 GB krātuve.

Negatīvais ir tas, ka izlases rakstīšanas operācijas tiks palēninātas, pateicoties papildu skaitļošanas un rakstīšanas operācijām, kas saistītas ar paritātes bloku. Arī uzticamība nav tik laba kā n + 1 spoguļdiski, kuros var sagatavoties jebkuram patvaļīgam disku skaitam.

RAID konfigurācijas var būt tik sarežģītas vai tik vienkāršas, cik vēlaties, varat apvienot paritātes un spoguļošanas stratēģijas un modificēt tās pēc sava uzņēmuma vēlmēm. Ir īpaši RAID kontrolieri, kuriem pievienojat savus fiziskos diskus, un OS pēc tam redz vienu loģisku disku, kā parādīts kontrolierī. LSI ir viens no šādiem RAID kontrolieru pārdevējiem. Jūs varat arī veikt RAID programmatūrā OpenZFS, iespējams, ir labākā likme, kas jums šajā ziņā ir.

Viens no pēdējiem RAID veidiem, par kuriem ir goda raksts, ir RAID 0. Tehniski tā nav RAID shēma, jo šeit nav iesaistīta atlaišana. RAID 0 ideja ir vienkārši izplatīt datus vairākās atmiņas ierīcēs bez jebkurš izturība pret diska kļūmēm. Priekšrocība ir tā, ka šādi rīkojoties, jūs varat uzlabot veiktspēju. Ja vienā diskā rakstāt 1 GB datu, process ir lēns. Diskā var veikt tikai ierobežotu skaitu rakstīšanas darbību sekundē, un jūsu OS ir jāgaida, līdz tas pabeidz šo darbību, pirms tiek nosūtīti jauni dati. Ja jūs izplatāt vienu un to pašu 1 GB datu divos šādos diskos, varat vienlaikus rakstīt (un lasīt) no abiem un iegūt diezgan daudz veiktspējas uzlabojumu.

Atpakaļ

Dublējumu jēdziens ir apstrīdams daudz svarīgāks nekā RAID. Dublējums krātuves pārvaldības kontekstā ir zināma laba datu kopija no noteikta laika, no kuras failus pēc vajadzības varat atjaunot atpakaļ galvenajā sistēmā. Īstenošanas ziņā ir daudz mākoņu mitinātu risinājumu un daudzi bezsaistes risinājumi, kurus var izmantot.

Tarsnap un Backblaze ir mani iecienītākie pārvaldītie dublēšanas pakalpojumi gan privātām, gan uzņēmējdarbības vajadzībām. Šajā a definīcijā varat iekļaut arī Google disku, iCloud vai Dropbox dublējums risinājums, bet tie ir vairāk orientēti uz patērētāju tirgu nekā uz uzņēmumu. Tomēr pamatprincips joprojām ir tāds pats. Pierakstoties jaunā iPhone vai iPad, visi dati, jūsu kontakti, fotoattēli, multivides bibliotēka utt. Tiek nemanāmi sinhronizēti no jūsu iCloud konta, un, turpinot lietot ierīci, jaunākie dati tiek klusi dublēti mākonī, un jūs to nedarāt. par to nav jāuztraucas.

Dublēšanas risinājums var būt tikpat vienkāršs kā datu kopēšana uz ārēju cieto disku vai izmantot rsync (vai zfs send, ja izmantojat OpenZFS), lai periodiski ģenerētu visas attiecīgās informācijas kopiju. Tas var ietvert jūsu dokumentu mapi, datu bāzi, avota repozitoriju vai pat visu sakņu failu sistēmu, kas tiek ievietota plakanā ZIP failā vai tarball. Svarīgi kritēriji, kuriem jāatbilst labam rezerves risinājumam, ir šādi:

  1. Dublējumiem vajadzētu notikt bieži - ja dublējat datus katru mēnesi, nevis katru nedēļu, riskējat zaudēt pat mēneša datus, ja notiek katastrofa.
  2. Jūsu dublējumkopijām vajadzētu atgriezties laikā - dublējuma krātuve ir ierobežota. Dažreiz jums ir jāizmet vecāki dublējumi. Jo vairāk jums ir krātuves, jo labāki var būt jūsu dublējumi. Pieņemsim, ka dublējat savus datus katru nedēļu, bet izmetiet dublējumkopijas, kas vecākas par 2 nedēļām. Ja fails tiek nejauši izdzēsts un tas tiek pamanīts divas nedēļas, jums nebūs iespējas to atgriezt.
  3. Jūsu failiem faktiski vajadzētu būt atjaunojamiem - ja jūs nekad neesat mēģinājis atgūt datus no dublējuma, jums nav dublējuma. Jums nevajadzētu uzzināt, kā atgūt datus kritiskajā brīdī, kad cietāt datu zudumu. Plānojiet uz priekšu un zināt, kā atjaunot sistēmu no pēdējā zināmā labā dublējuma.
  4. Jūsu dublējums ir jānodala no darbojošās sistēmas - kad notiek katastrofa un visi jūsu faili ražošanas serverī tiek šifrēti, izdzēsti vai bojāti, jums jāpārliecinās, ka tas pats nenotiek ar jūsu dublējumu. Viens labs veids, kā to nodrošināt, ir pārliecināties, ka dublēšanas ierīce nav “savienota” ar ražošanas vidi, t.e, atvienojiet USB cieto disku, atvienojiet NFS failu sistēmu, kad esat pabeidzis tā dublēšanu. Vismaz nedodiet ražošanas sistēmai privilēģiju pārrakstīt vai modificēt dublējuma datus. Padariet to tikai lasāmu.

Tagad, kad mēs zinām mazliet gan par RAID, gan dublēšanu, uzsvērsim dažas atšķirības starp tām.

Faili un bloki

RAID vienmēr attiecas uz datu blokiem, nevis uz to, kā failu sistēma šos datus uzrāda lietotājam. Gan programmatūras, gan aparatūras RAID datus apstrādā kā informācijas blokus, bloku lielums var svārstīties no 128 KiB līdz 1 MiB.

No otras puses, dublējumi ir daudz elastīgāki. Parasti tos veic failu sistēmas līmenī, lai gan nav stingru noteikumu, lai tas tā būtu. Tie ir arī sīkāki. Varat atjaunot vienu failu no dublējuma, ja jūsu risinājums ir pietiekami elastīgs. RAID masīvi nav dublējumi, tie ir tikai veids, kā izplatīt datus vairākos diskos. Ja fails tiek izdzēsts, tiek atbrīvoti visi tā spoguļu bloki un paritātes bloki. Stāsta beigas.

Lietot lietas

Dublējumi ir domāti visiem. Pieeja un apjoms katrā personīgā lietojumā var atšķirties, taču ikvienam, kam ir digitālā dzīve, nepieciešama dublēšana. RAID ir vairāk uzņēmējdarbībai / uzņēmumam raksturīga iezīme. Jūs redzat RAID blokus serveros, atmiņas ierīcēs, piemēram, NAS un SAN, mākoņu hipervizoros utt. Gandrīz jebkurā vietā, kur tiek glabāti dzīvie kritiskie dati, tiek izmantota kāda veida RAID. Pat tie serveri, kuros darbojas jūsu mākoņa mitinātās dublējumkopijas, iespējams, izmanto RAID masīvus. Tās nav savstarpēji izslēdzošas tehnoloģijas.

Tas nenozīmē, ka jūs nevarat izmantot RAID personiskai lietošanai, bet tas vienkārši ir vairāk noderīgs uzņēmumos. Daļa iemesla ir tas, ka uzņēmumā diski tiek dauzīti ar IO darbībām visu diennakti. Ražošanas vidē, piemēram, datu bāzes vai video straumēšanas pakalpojuma vai mākoņa hipervizora glabāšanai, jūsu servera glabāšanas ierīcei būs pastāvīga šausmīga slodze, dati tiek nepārtraukti nolasīti un rakstīti uz šīm ierīcēm, un bieži vien vairākas lietojumprogrammas vienlaikus. Šādos apstākļos jūsu diski ir daudz biežāk izgāzušies. RAID konfigurācija nozīmē, ka, ja disks neizdodas, dīkstāves laiks ir maz vai vispār nav. Lielākā daļa serveru var turpināt darboties pat pēc diska kļūmes, lai jūs nezaudētu jaunu informāciju un pieprasījumus, kas nāk katru sekundi.

Vidējs galddators diez vai var atjaunot to pašu stresa stāvokli, pat ja disks nomirst, ja izmantojat dublējuma risinājumu, piemēram, Backblaze, varat izgūt lielāko daļu zaudēto datu, un, iespējams, vissliktākais ir zaudēt dažas stundas ilgu darbu var gadīties. Pat tas kļūst par retumu, pateicoties mākoņu mitinātiem risinājumiem, piemēram, Adobe Creative Cloud, Office 365 utt.

RAID neaizstāj Backup

Ja no šī raksta vēlaties vienu atņemšanu, tam vajadzētu būt šādam. RAID NAV aizstājējs Backup. Vienmēr dublējiet savus datus! Tur ir daudz cilvēku, kuri domā, ka, ja jums ir RAID, tas nozīmē, ka dati ir droši vairākos diskos, tāpēc tos nav nepieciešams dublēt. Nekas nav tālāk no patiesības. RAID ir paredzēts, lai risinātu vienu konkrētu problēmu - disku kļūme vai kļūdainu datu atdošana. RAID lietošana neaizsargās jūs no miljona citu draudu, piemēram:

  1. Lietotāju kļūdas un nejaušas dzēšanas
  2. Lietojumprogrammu vai OS kļūdas, kas izraisa plašu datu bojājumu
  3. Ransomware vai cita ļaunprātīga programmatūra šifrē, dzēš vai bojā jūsu datus
  4. Pašu RAID kontrolieru kļūme

Jūsu RAID masīva dati ir tiešsaistē. Ja operētājsistēma, lietojumprogramma (vai lietotājs) iet uz priekšu un izdzēš dažus failus šeit un tur, fails tiks izdzēsts visā jūsu RAID masīvā. Atsevišķa datu kopija un dublējums ir vienīgais veids, kā jūs jebkad varat pasargāt sevi no šāda veida scenārija.

Secinājums

Ja jūs uztraucat savus datus, jums vispirms vajadzētu būt rezerves risinājumam. Lielākajai daļai darbvirsmas lietotāju, izņemot varbūt enerģijas lietotājus, vairāk jāiegulda drošā dublējumā, nevis jāturpina ar RAID1, RAID5 vai RAIDZ. Ja vēlaties izveidot savu rezerves serveri, jums ir jādomā par pienācīgu dublēšanas politiku un uzticamu krātuves aizmuguri. Šis raksts varbūt ir laba vieta, kur sākt. Varat izmantot rsync vai zfs send, lai paņemtu datu kopiju šajā aizmugurē.

Ja atrodaties uzņēmumā un apsverat RAID risinājumu, lai saglabātu visus jūsu tiešraides datus. Apsveriet iespēju izmantot OpenZFS, tas piedāvā ļoti elastīgu risinājumu, sākot no n-diska spoguļošanas līdz RAIDZ1 ar vienu paritātes bloku līdz RAIDZ2 un RAIDZ3 ar 2 un 3 paritātes blokiem. Pirms lēmuma pieņemšanas daudz jāapsver pieteikuma prasības. Starp lasīšanas un rakstīšanas veiktspēju, noturību un uzglabāšanas efektivitāti pastāv kompromisi. Tomēr es iesaku domāt par RAID tikai pēc tam, kad esat izlēmis izveidot rezerves risinājumu.

Kā izmantot Xdotool, lai stimulētu peles klikšķus un taustiņsitienus Linux
Xdotool ir bezmaksas un atvērtā koda komandrindas rīks peles klikšķu un taustiņu simulāciju simulēšanai. Šajā rakstā būs īss ceļvedis par xdotool izma...
5 labākie ergonomiskie datoru peles izstrādājumi Linux
Vai ilgstoša datora lietošana izraisa sāpes plaukstas locītavā vai pirkstos? Vai jūs ciešat no stīvām locītavām un jums pastāvīgi ir jāspiež rokas? Va...
How to Change Mouse and Touchpad Settings Using Xinput in Linux
Most Linux distributions ship with “libinput” library by default to handle input events on a system. It can process input events on both Wayland and X...