Datu zinātne

Python Seaborn apmācība

Python Seaborn apmācība
Šajā nodarbībā par Python Seaborn bibliotēku mēs aplūkosim dažādus šīs datu vizualizācijas bibliotēkas aspektus, kurus mēs varam izmantot kopā ar Python, lai radītu skaistus un intuitīvus grafikus, kas var vizualizēt datus tādā formā, kādu bizness vēlas no platformas. Lai šī nodarbība būtu pabeigta, mēs aplūkosim šādas sadaļas:

Tas izskatās daudz, lai segtu. Sāksim tagad.

Kas ir Python Seaborn bibliotēka?

Seaborn bibliotēka ir Python pakete, kas ļauj mums izveidot infografiku, pamatojoties uz statistikas datiem. Tā kā tas ir izgatavots virs matplotlib, tā tas pēc savas būtības ir saderīgs. Turklāt tas atbalsta NumPy un Pandas datu struktūru, lai zīmēšanu varētu veikt tieši no šīm kolekcijām.

Sarežģītu datu vizualizēšana ir viena no vissvarīgākajām lietām, par kuru rūpējas Sīborns. Ja mēs salīdzinātu Matplotlib ar Seaborn, Seaborn spēj viegli padarīt tās lietas, kuras ir grūti sasniegt ar Matplotlib. Tomēr ir svarīgi to atzīmēt Seaborn nav alternatīva Matplotlib, bet gan tā papildinājums. Šīs nodarbības laikā Matplotlib funkcijas izmantosim arī kodu fragmentos. Jūs izvēlēsities strādāt ar Seaborn šādos gadījumos:

Pirms sākšanas ir tikai piezīme, ka šai nodarbībai mēs izmantojam virtuālo vidi, kuru izveidojām ar šādu komandu:

pitons -m virtualenv jūrdzimis
avots seaborn / bin / aktivizēt

Kad virtuālā vide ir aktīva, mēs varam instalēt Seaborn bibliotēku virtuālajā env, lai varētu izpildīt nākamos veidotos piemērus:

pip instalēt jūras dzimušo

Varat izmantot arī Anaconda, lai palaistu šos vienkāršākos piemērus. Ja vēlaties to instalēt savā datorā, skatiet nodarbību, kurā aprakstīts “Kā instalēt Anaconda Python uz Ubuntu 18.04 LTS ”un dalieties savās atsauksmēs. Tagad virzīsimies uz dažāda veida parauglaukumiem, kurus var izveidot ar Python Seaborn.

Izmantojot Pokemon datu kopu

Lai saglabātu šo nodarbību praktiski, mēs izmantosim Pokemon datu kopu, kuru var lejupielādēt no Kaggle. Lai importētu šo datu kopu mūsu programmā, mēs izmantosim bibliotēku Pandas. Šeit ir visi importētie produkti, kurus veicam mūsu programmā:

importa pandas kā pd
no matplotlib importa pyplot kā plt
ievest jūras dzimušus kā sns

Tagad mēs varam importēt datu kopu savā programmā un parādīt dažus parauga datus ar Pandas kā:

df = pd.read_csv ('Pokemon.csv ', index_col = 0)
df.galva ()

Ņemiet vērā, ka, lai palaistu iepriekš minēto koda fragmentu, CSV datu kopai jābūt tajā pašā direktorijā, kurā atrodas pati programma. Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi (Anaconda Jupyter piezīmju grāmatiņā):

Lineārās regresijas līknes uzzīmēšana

Viena no labākajām lietām Seabornā ir tās piedāvātās inteliģentās zīmēšanas funkcijas, kas ne tikai vizualizē tai piedāvāto datu kopu, bet arī ap to konstruē regresijas modeļus. Piemēram, ir iespējams izveidot lineāru regresijas diagrammu ar vienu koda rindu. Lūk, kā to izdarīt:

sns.lmplot (x = 'Uzbrukums', y = 'Aizsardzība', dati = df)

Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:

Iepriekš minētajā koda fragmentā mēs pamanījām dažas svarīgas lietas:

Nebaidieties, ja domājāt, ka bez šīs regresijas līnijas mums nevar būt sižets. Mēs varam ! Tagad izmēģināsim jaunu koda fragmentu, līdzīgu pēdējam:

sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = False)

Šoreiz mēs savā sižetā neredzēsim regresijas līniju:

Tagad tas ir daudz skaidrāk (ja mums nav nepieciešama lineārā regresijas līnija). Bet tas vēl nav tikai beidzies. Seaborn ļauj mums padarīt šo sižetu atšķirīgu, un to mēs darīsim.

Kastes gabalu konstruēšana

Viena no lielākajām Seaborn iezīmēm ir tā, kā tā viegli pieņem Pandas Dataframes struktūru, lai attēlotu datus. Mēs varam vienkārši nodot datu ietvaru Seaborn bibliotēkai, lai tā no tā varētu izveidot lodziņu:

sns.lodziņš (dati = df)

Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:

Mēs varam noņemt kopējo pirmo lasījumu, jo tas izskatās nedaudz neērti, kad mēs šeit faktiski plānojam atsevišķas kolonnas:

stats_df = df.kritums (['Kopā'], ass = 1)
# Jauns lodziņš, izmantojot stats_df
sns.boxplot (dati = stats_df)

Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:

Spieta sižets ar Seaborn

Mēs varam izveidot intuitīvu Swarm sižetu ar Seaborn. Mēs atkal izmantosim datu bāzi no Pandas, kuru mēs ielādējām agrāk, bet šoreiz mēs izsauksim Matplotlib šova funkciju, lai parādītu mūsu izveidoto sižetu. Šis ir koda fragments:

sns.set_context ("papīrs")
sns.swarmplot (x = "Uzbrukums", y = "Aizsardzība", dati = df)
plt.rādīt ()

Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:

Izmantojot Seaborn kontekstu, mēs ļaujam Seaborn pievienot sižetam personisku pieskārienu un plūstošu noformējumu. Lai atvieglotu lasīšanu, ir iespējams šo diagrammu vēl vairāk pielāgot, izmantojot pielāgotu fonta lielumu, ko izmanto zemes gabala etiķetēm. Lai to izdarītu, mēs nodosim vairāk parametru funkcijai set_context, kas darbojas tāpat kā tās, kuras tās izklausās. Piemēram, lai mainītu etiķešu fonta lielumu, mēs izmantosim fontu.lieluma parametrs. Šeit ir koda fragments, lai veiktu modifikāciju:

sns.set_context ("papīrs", font_scale = 3, rc = "fonts.izmērs ": 8", asis.labelsize ": 5)
sns.swarmplot (x = "Uzbrukums", y = "Aizsardzība", dati = df)
plt.rādīt ()

Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:

Etiķetes fonta lielums tika mainīts, pamatojoties uz mūsu norādītajiem parametriem un vērtību, kas saistīta ar fontu.lieluma parametrs. Viena lieta, ko Seaborn ir lietpratējs, ir padarīt sižetu ļoti intuitīvu praktiskai lietošanai, un tas nozīmē, ka Seaborn nav tikai prakses Python pakete, bet faktiski kaut kas tāds, ko mēs varam izmantot ražošanas izvietojumos.

Virsraksta pievienošana sižetiem

Mūsu sižetiem ir viegli pievienot nosaukumus. Mums vienkārši jāievēro vienkārša Axes līmeņa funkciju izmantošanas procedūra, kur mēs to sauksim set_title () darbojas tāpat kā mēs šeit parādām koda fragmentā:

sns.set_context ("papīrs", font_scale = 3, rc = "fonts.izmērs ": 8", asis.labelsize ": 5)
my_plot = sns.swarmplot (x = "Uzbrukums", y = "Aizsardzība", dati = df)
my_plot.set_title ("LH spiets")
plt.rādīt ()

Kad mēs izpildīsim iepriekš minēto koda fragmentu, mēs redzēsim šādu izvadi:

Tādā veidā mēs varam pievienot daudz vairāk informācijas saviem sižetiem.

Seaborn vs Matplotlib

Aplūkojot šīs nodarbības piemērus, mēs varam noteikt, ka Matplotlib un Seaborn nevar tieši salīdzināt, bet tos var uzskatīt par viens otru papildinošiem. Viena no iezīmēm, kas Seaborn veic vienu soli priekšā, ir veids, kā Seaborn var statistiski vizualizēt datus.

Lai vislabāk izmantotu Seaborn parametrus, mēs ļoti iesakām iepazīties ar Seaborn dokumentāciju un uzzināt, kādus parametrus izmantot, lai jūsu zemes gabals būtu pēc iespējas tuvāks biznesa vajadzībām.

Secinājums

Šajā nodarbībā mēs apskatījām dažādus šīs datu vizualizācijas bibliotēkas aspektus, kurus mēs varam izmantot kopā ar Python, lai radītu skaistus un intuitīvus grafikus, kas var vizualizēt datus tādā formā, kādu bizness vēlas no platformas. Seaborm ir viena no vissvarīgākajām vizualizācijas bibliotēkām, kad runa ir par datu inženieriju un datu parādīšanu lielākajā daļā vizuālo formu, kas noteikti ir prasme, kas mums jāpiemīt zem jostas, jo tā ļauj mums izveidot lineāras regresijas modeļus.

Lūdzu, dalieties savās atsauksmēs par nodarbību Twitter vietnē @sbmaggarwal un @LinuxHint.

Kā mainīt peles rādītāja un kursora izmēru, krāsu un shēmu operētājsistēmā Windows 10
Peles rādītājs un kursors operētājsistēmā Windows 10 ir ļoti svarīgi operētājsistēmas aspekti. To var teikt arī par citām operētājsistēmām, tāpēc pati...
Bezmaksas un atvērtā koda spēļu dzinēji Linux spēļu izstrādei
Šis raksts aptvers bezmaksas un atvērtā koda spēļu motoru sarakstu, kurus var izmantot, lai izstrādātu 2D un 3D spēles Linux. Šādu spēļu dzinēju ir da...
Tomb Raider for Linux apmācība
Tomb Raider ēna ir divpadsmitais papildinājums Tomb Raider sērijai - darbības piedzīvojumu spēļu franšīzei, kuru izveidoja Eidos Montreal. Spēli gan k...