- Kas ir Python Seaborn?
- Parauglaukumu veidi, kurus mēs varam izveidot ar Seabornu
- Darbs ar vairākiem sižetiem
- Dažas alternatīvas Python Seaborn
Tas izskatās daudz, lai segtu. Sāksim tagad.
Kas ir Python Seaborn bibliotēka?
Seaborn bibliotēka ir Python pakete, kas ļauj mums izveidot infografiku, pamatojoties uz statistikas datiem. Tā kā tas ir izgatavots virs matplotlib, tā tas pēc savas būtības ir saderīgs. Turklāt tas atbalsta NumPy un Pandas datu struktūru, lai zīmēšanu varētu veikt tieši no šīm kolekcijām.
Sarežģītu datu vizualizēšana ir viena no vissvarīgākajām lietām, par kuru rūpējas Sīborns. Ja mēs salīdzinātu Matplotlib ar Seaborn, Seaborn spēj viegli padarīt tās lietas, kuras ir grūti sasniegt ar Matplotlib. Tomēr ir svarīgi to atzīmēt Seaborn nav alternatīva Matplotlib, bet gan tā papildinājums. Šīs nodarbības laikā Matplotlib funkcijas izmantosim arī kodu fragmentos. Jūs izvēlēsities strādāt ar Seaborn šādos gadījumos:
- Jums ir statistikas laika rindu dati, kas jāzīmē, norādot nenoteiktību ap tāmēm
- Vizuāli noteikt atšķirību starp divām datu apakškopām
- Vizualizēt vienmaču un divvariantu sadalījumus
- Pievienojot daudz lielāku vizuālo pievilcību matplotlib parauglaukumiem ar daudzām iebūvētām tēmām
- Lai pielāgotu un vizualizētu mašīnmācīšanās modeļus, izmantojot lineāru regresiju ar neatkarīgiem un atkarīgiem mainīgajiem
Pirms sākšanas ir tikai piezīme, ka šai nodarbībai mēs izmantojam virtuālo vidi, kuru izveidojām ar šādu komandu:
pitons -m virtualenv jūrdzimisavots seaborn / bin / aktivizēt
Kad virtuālā vide ir aktīva, mēs varam instalēt Seaborn bibliotēku virtuālajā env, lai varētu izpildīt nākamos veidotos piemērus:
pip instalēt jūras dzimušoVarat izmantot arī Anaconda, lai palaistu šos vienkāršākos piemērus. Ja vēlaties to instalēt savā datorā, skatiet nodarbību, kurā aprakstīts “Kā instalēt Anaconda Python uz Ubuntu 18.04 LTS ”un dalieties savās atsauksmēs. Tagad virzīsimies uz dažāda veida parauglaukumiem, kurus var izveidot ar Python Seaborn.
Izmantojot Pokemon datu kopu
Lai saglabātu šo nodarbību praktiski, mēs izmantosim Pokemon datu kopu, kuru var lejupielādēt no Kaggle. Lai importētu šo datu kopu mūsu programmā, mēs izmantosim bibliotēku Pandas. Šeit ir visi importētie produkti, kurus veicam mūsu programmā:
importa pandas kā pdno matplotlib importa pyplot kā plt
ievest jūras dzimušus kā sns
Tagad mēs varam importēt datu kopu savā programmā un parādīt dažus parauga datus ar Pandas kā:
df = pd.read_csv ('Pokemon.csv ', index_col = 0)df.galva ()
Ņemiet vērā, ka, lai palaistu iepriekš minēto koda fragmentu, CSV datu kopai jābūt tajā pašā direktorijā, kurā atrodas pati programma. Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi (Anaconda Jupyter piezīmju grāmatiņā):
Lineārās regresijas līknes uzzīmēšana
Viena no labākajām lietām Seabornā ir tās piedāvātās inteliģentās zīmēšanas funkcijas, kas ne tikai vizualizē tai piedāvāto datu kopu, bet arī ap to konstruē regresijas modeļus. Piemēram, ir iespējams izveidot lineāru regresijas diagrammu ar vienu koda rindu. Lūk, kā to izdarīt:
sns.lmplot (x = 'Uzbrukums', y = 'Aizsardzība', dati = df)Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:
Iepriekš minētajā koda fragmentā mēs pamanījām dažas svarīgas lietas:
- Seaborn ir pieejama īpaša zīmēšanas funkcija
- Mēs izmantojām Sīborna uzstādīšanas un uzzīmēšanas funkciju, kas mums nodrošināja lineāru regresijas līniju, kuru tā pati modelēja
Nebaidieties, ja domājāt, ka bez šīs regresijas līnijas mums nevar būt sižets. Mēs varam ! Tagad izmēģināsim jaunu koda fragmentu, līdzīgu pēdējam:
sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = False)Šoreiz mēs savā sižetā neredzēsim regresijas līniju:
Tagad tas ir daudz skaidrāk (ja mums nav nepieciešama lineārā regresijas līnija). Bet tas vēl nav tikai beidzies. Seaborn ļauj mums padarīt šo sižetu atšķirīgu, un to mēs darīsim.
Kastes gabalu konstruēšana
Viena no lielākajām Seaborn iezīmēm ir tā, kā tā viegli pieņem Pandas Dataframes struktūru, lai attēlotu datus. Mēs varam vienkārši nodot datu ietvaru Seaborn bibliotēkai, lai tā no tā varētu izveidot lodziņu:
sns.lodziņš (dati = df)Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:
Mēs varam noņemt kopējo pirmo lasījumu, jo tas izskatās nedaudz neērti, kad mēs šeit faktiski plānojam atsevišķas kolonnas:
# Jauns lodziņš, izmantojot stats_df
sns.boxplot (dati = stats_df)
Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:
Spieta sižets ar Seaborn
Mēs varam izveidot intuitīvu Swarm sižetu ar Seaborn. Mēs atkal izmantosim datu bāzi no Pandas, kuru mēs ielādējām agrāk, bet šoreiz mēs izsauksim Matplotlib šova funkciju, lai parādītu mūsu izveidoto sižetu. Šis ir koda fragments:
sns.set_context ("papīrs")sns.swarmplot (x = "Uzbrukums", y = "Aizsardzība", dati = df)
plt.rādīt ()
Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:
Izmantojot Seaborn kontekstu, mēs ļaujam Seaborn pievienot sižetam personisku pieskārienu un plūstošu noformējumu. Lai atvieglotu lasīšanu, ir iespējams šo diagrammu vēl vairāk pielāgot, izmantojot pielāgotu fonta lielumu, ko izmanto zemes gabala etiķetēm. Lai to izdarītu, mēs nodosim vairāk parametru funkcijai set_context, kas darbojas tāpat kā tās, kuras tās izklausās. Piemēram, lai mainītu etiķešu fonta lielumu, mēs izmantosim fontu.lieluma parametrs. Šeit ir koda fragments, lai veiktu modifikāciju:
sns.swarmplot (x = "Uzbrukums", y = "Aizsardzība", dati = df)
plt.rādīt ()
Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:
Etiķetes fonta lielums tika mainīts, pamatojoties uz mūsu norādītajiem parametriem un vērtību, kas saistīta ar fontu.lieluma parametrs. Viena lieta, ko Seaborn ir lietpratējs, ir padarīt sižetu ļoti intuitīvu praktiskai lietošanai, un tas nozīmē, ka Seaborn nav tikai prakses Python pakete, bet faktiski kaut kas tāds, ko mēs varam izmantot ražošanas izvietojumos.
Virsraksta pievienošana sižetiem
Mūsu sižetiem ir viegli pievienot nosaukumus. Mums vienkārši jāievēro vienkārša Axes līmeņa funkciju izmantošanas procedūra, kur mēs to sauksim set_title () darbojas tāpat kā mēs šeit parādām koda fragmentā:
sns.set_context ("papīrs", font_scale = 3, rc = "fonts.izmērs ": 8", asis.labelsize ": 5)my_plot = sns.swarmplot (x = "Uzbrukums", y = "Aizsardzība", dati = df)
my_plot.set_title ("LH spiets")
plt.rādīt ()
Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:
Tādā veidā mēs varam pievienot daudz vairāk informācijas saviem sižetiem.
Seaborn vs Matplotlib
Aplūkojot šīs nodarbības piemērus, mēs varam noteikt, ka Matplotlib un Seaborn nevar tieši salīdzināt, bet tos var uzskatīt par viens otru papildinošiem. Viena no iezīmēm, kas Seaborn veic vienu soli priekšā, ir veids, kā Seaborn var statistiski vizualizēt datus.
Lai vislabāk izmantotu Seaborn parametrus, mēs ļoti iesakām iepazīties ar Seaborn dokumentāciju un uzzināt, kādus parametrus izmantot, lai jūsu zemes gabals būtu pēc iespējas tuvāks biznesa vajadzībām.
Secinājums
Šajā nodarbībā mēs apskatījām dažādus šīs datu vizualizācijas bibliotēkas aspektus, kurus mēs varam izmantot kopā ar Python, lai radītu skaistus un intuitīvus grafikus, kas var vizualizēt datus tādā formā, kādu bizness vēlas no platformas. Seaborm ir viena no vissvarīgākajām vizualizācijas bibliotēkām, kad runa ir par datu inženieriju un datu parādīšanu lielākajā daļā vizuālo formu, kas noteikti ir prasme, kas mums jāpiemīt zem jostas, jo tā ļauj mums izveidot lineāras regresijas modeļus.
Lūdzu, dalieties savās atsauksmēs par nodarbību Twitter vietnē @sbmaggarwal un @LinuxHint.