pandas

Kā izmantot Boxplot Python

Kā izmantot Boxplot Python
Kastes diagramma tiek izmantota, lai apkopotu datu kopas, izmantojot lodziņa un ūsas parauglaukuma metodi. Šī funkcija palīdz lietotājiem pareizi izprast datu kopsavilkumu. Kastīšu diagrammas var būt ļoti noderīgas, ja mēs vēlamies uzzināt, kā dati tiek izplatīti un izplatīti. Datu uzzīmēšanai lodziņa diagrammā tiek izmantoti trīs veidu kvartiles. Šīs vērtības ietver vidējo, maksimālo, minimālo, augšējās kvartiles un apakšējās kvartiles statistiskās vērtības. Kastes diagramma apkopo šos datus 25th, 50th, un 75. lppth procentiles. Šī apmācība parādīs, kā izveidot lodziņu diagrammas, pamatojoties uz noteiktu datu kopu, izmantojot pandas un jūras dzimis Python bibliotēkas.

Priekšnoteikums

Ja esat jauns Python lietotājs, vispirms būs jāiestata vide, lai parādītu lodziņa diagrammas izvadi. Koda izpildei varat izmantot jebkuru Python tulku. Šajā apmācībā es izmantošu spiegers3 lai izpildītu kodu. Ja neesat instalējis pandas un jūras dzimis bibliotēkas iepriekš, tad, lai instalētu šīs bibliotēkas, no termināla palaidiet šādu komandu:

$ pip3 instalējiet pandas jūras dzimušus

Kastīšu sižeti ar pandām

The lodziņš () metode pandas tiek izmantots, lai ģenerētu lodziņa diagrammas attēlus, pamatojoties uz datu rāmi. Šī metode satur daudz argumentu; daži no šiem argumentiem tiek izmantoti tālāk sniegtajos piemēros. Šajā apmācības daļā būs divi piemēri, kas parādīs, kā izveidot lodziņu diagrammas pandas. Jūs varat izmantot nejauši ģenerētus datus NumPy bibliotēkā vai datus no CSV faila, lai ģenerētu lodziņa diagrammu pandas.

1. piemērs: lodziņu diagrammas, pamatojoties uz nejaušām vērtībām

Šajā lodziņā redzamie lodziņi ir ģenerēti, izmantojot NumPy un pandas. NumPy bibliotēka tiek izmantota skriptā, lai izveidotu datu ietvara objektu, ģenerējot nejaušo vērtību divdimensiju masīvu, kas satur 5 rindas un 5 kolonnas. Datu rāmja saturs tiks izdrukāts, izmantojot galva() metodi. Tālāk lodziņš () metodi izmanto, lai izveidotu lodziņu diagrammas ar zilu krāsu, fonta lielumu 10 un 30 grādu rotācijas leņķi kolonnu vērtību parādīšanai.

#!/ usr / bin / env python3
# Importēt pandas bibliotēku
importa pandas kā pd
# Importējiet NumPy bibliotēku, lai izveidotu masīva nejaušus skaitļus
importēt numpy kā np
"
Ģenerēt datu kopu, pamatojoties uz nejauši izveidotu NumPy masīvu
un piecu kolonnu vērtības
"
datu ietvars = pd.DataFrame (np.nejaušs.randns (5,5), kolonnas = ['2016', '2017', '2018',
“2019”, “2020”])
 
# Izdrukājiet datu ietvara vērtības
drukāt (datu ietvars.galva ())
# Parādīt lodziņa diagrammu, pamatojoties uz datu ietvara vērtībām
datu ietvars.boxplot (režģis = 'false', color = 'blue', fontsize = 10, rot = 30)

Rezultāts

Pēc koda izpildes parādīsies šāda izeja.

2. piemērs: lodziņu diagrammas, kuru pamatā ir CSV dati

Šajā lodziņā redzamie lodziņi tika ģenerēti no CSV datiem. Izveidojiet CSV failu ar nosaukumu banka.csv izmantojot šādus datus.

banka.csv

SL, klienta_nosaukums, konta tips, dzimums, atlikums
1, Marija Ernandesa, taupīšana, sieviete, 120000
2, Mērija Smita, Pašreizējā, Sieviete, 40000
3, Deivids Smits, pašreizējais, vīrietis, 379000
4, Marija Rodrigesa, taupīšana, sieviete, 56000
5, Marks Lī, glābējs, vīrietis, 93500
6, Džonatans Bings, pašreizējais, vīrietis, 5900
7, Daniels Viljamss, Savings, vīrietis, 2300
8, Maiks Brauns, Pašreizējais, Vīrietis, 124888
9, Pols Smits, pašreizējais, vīrietis, 59450
10, Marija Lopesa, taupīšana, sieviete, 487600

Šajā rakstā matplotlib bibliotēka tika izmantota, lai iestatītu lodziņa diagrammas figūras lielumu un parādītu izvades rindu. Visi. Ieraksti banka.csv fails tika ielādēts, izmantojot lasīt_csv () metode pandas. Pēc tam pirmie 8 datu rāmja ieraksti tika izdrukāti, izmantojot galva () metodi. The lodziņš () metode tika izmantota šajā paziņojumā, lai uzzīmētu lodziņa diagrammas attēlu, izmantojot sarkanu krāsu, pamatojoties uz 'Konta tips' ar kolonnu ar nosaukumu “Līdzsvars."

#!/ usr / bin / env python3
# Importējiet pandas, lai ģenerētu lodziņu
importa pandas kā pd
# Importējiet matplotlib, lai iestatītu lodziņa diagrammas figūras lielumu
importa matplotlib.pyplot kā plt
# Importējiet get_ipython, lai formatētu izvades rindu
no IPython importa get_ipython
get_ipython ().run_line_magic ('matplotlib', 'iekļauts')
# Iestatiet figūras lielumu
plt.rcParams ['figūra.figsize '] = (8,4)
# Ielādējiet datu kopu no CSV faila
df = pd.lasīt_csv ("banka.csv ")
# Izdrukājiet pirmās 8 ielādēto datu rindas
izdruka (df.galva (8))
# Parādīt lodziņu diagrammas, pamatojoties uz izmantoto parametru
df.boxplot (pēc = 'Account_Type', režģis = 'True', kolonna = ['Bilance'], color = 'red')

Rezultāts

Pēc koda izpildes parādīsies šāda izeja.

Kastīti ar jūras dzimušajiem

Vēl viena Python bibliotēka, ko parasti izmanto lodziņu uzzīmēšanai, ir bibliotēka jūras dzimis.  Viena no svarīgām šīs bibliotēkas iezīmēm ir tā, ka tajā ir daudz iebūvētu datu kopu paraugu, lai pārbaudītu dažādus uzdevumus. Nākamie divi piemēri aptvers divu dažādu paraugu datu kopu izmantošanu lodziņu diagrammu zīmēšanai, izmantojot jūras dzimis bibliotēka.

3. piemērs: lodziņu diagrammas, pamatojoties uz parametru x

Šajā piemērā tiek izmantots datu kopas paraugs “dimanti, ” no jūras dzimušais bibliotēku, lai ģenerētu kastes gabalu. Šeit režģa stils tiek definēts, izmantojot set_style () metodi. The load_dataset () metodi izmanto, lai ielādētu datusdimanti datu kopa. Pirmie pieci ieraksti tiek izdrukāti no datu kopas un lodziņš () metodi izmanto, lai uzzīmētu lodziņa diagrammu, pamatojoties uz kolonnu ar nosaukumu 'dziļums,'ar zilu krāsu.

# Importējiet dzimušo bibliotēku, lai izveidotu lodziņu
ievest jūras dzimušus kā sns
# Importējiet matplotlib, lai iestatītu lodziņa diagrammas figūras lielumu
importa matplotlib.pyplot kā plt
# Importējiet get_ipython, lai formatētu izvades rindu
no IPython importēt get_ipython
get_ipython ().run_line_magic ('matplotlib', 'iekļauts')
# Iestatiet režģa stilu
sns.set_style ("whitegrid")
# Iestatiet figūras lielumu
plt.rcParams ['figūra.figsize '] = (8,4)
# Ielādējiet datu kopas paraugu
dimanta_datu kopa = sns.load_dataset ('dimanti')
# Parādiet pirmos 5 datu kopas ierakstus
drukāt (dimanta_datu kopa.galva ())
# Uzzīmējiet lodziņa diagrammu attēlu
sns.boxplot (x = dimanta_datu kopa ['dziļums'], krāsa = 'zils')

Rezultāts

Pēc koda izpildes parādīsies šāda izeja.

4. piemērs: lodziņu diagrammas, pamatojoties uz x un y parametriem

Šajā piemērā tiek izmantota parauga datu kopa ar nosaukumulidojumi', lai uzzīmētu kastes sižetu. Šeit gan x, gan y parametri lodziņš () metodi izmanto, lai uzzīmētu skaitli. Pārējie apgalvojumi ir līdzīgi iepriekšējam piemēram.

# Importējiet dzimušo bibliotēku, lai izveidotu lodziņu
ievest jūras dzimušus kā sns
# Importējiet matplotlib, lai iestatītu lodziņa diagrammas figūras lielumu
importa matplotlib.pyplot kā plt
# Importējiet get_ipython, lai formatētu izvades rindu
no IPython importa get_ipython
get_ipython ().run_line_magic ('matplotlib', 'iekļauts')
 
# Iestatiet režģa stilu
sns.set_style ("darkgrid")
# Iestatiet figūras lielumu
plt.rcParams ['figūra.figsize '] = (12,4)
 
# Ielādējiet datu kopas paraugu
flight_dataset = sns.load_dataset ('lidojumi')
# Parādiet pirmos 5 datu kopas ierakstus
drukāt (lidojuma_datu kopa.galva ())
 
# Uzzīmējiet lodziņa diagrammu attēlu
sns.boxplot (x = 'mēnesis', y = 'pasažieri', dati = lidojuma_datu kopa, krāsa = 'zils')

Rezultāts

Pēc koda izpildes parādīsies šāda izeja.

Secinājums

Strādājot ar lielu datu apjomu, ieteicams apkopot datus, izmantojot diagrammu, piemēram, lodziņa diagrammu. Šajā apmācībā tika izmantoti vairāki piemēri, lai parādītu, kā ģenerēt lodziņu diagrammas ar divām Python bibliotēkām.

Tomb Raider for Linux apmācība
Tomb Raider ēna ir divpadsmitais papildinājums Tomb Raider sērijai - darbības piedzīvojumu spēļu franšīzei, kuru izveidoja Eidos Montreal. Spēli gan k...
Kā palielināt FPS Linux?
FPS apzīmē Kadri sekundē. FPS uzdevums ir izmērīt kadru ātrumu video atskaņošanā vai spēļu izrādēs. Vienkāršos vārdos nepārtrauktu pilnekrāna attēlu s...
Populārākās Oculus App Lab spēles
Ja esat Oculus austiņu īpašnieks, jums ir jāsazinās par sānu ielādi. Sānu ielāde ir process, kurā austiņās tiek instalēts saturs, kas nav veikals. Sid...