Priekšnoteikums
Ja esat jauns Python lietotājs, vispirms būs jāiestata vide, lai parādītu lodziņa diagrammas izvadi. Koda izpildei varat izmantot jebkuru Python tulku. Šajā apmācībā es izmantošu spiegers3 lai izpildītu kodu. Ja neesat instalējis pandas un jūras dzimis bibliotēkas iepriekš, tad, lai instalētu šīs bibliotēkas, no termināla palaidiet šādu komandu:
$ pip3 instalējiet pandas jūras dzimušusKastīšu sižeti ar pandām
The lodziņš () metode pandas tiek izmantots, lai ģenerētu lodziņa diagrammas attēlus, pamatojoties uz datu rāmi. Šī metode satur daudz argumentu; daži no šiem argumentiem tiek izmantoti tālāk sniegtajos piemēros. Šajā apmācības daļā būs divi piemēri, kas parādīs, kā izveidot lodziņu diagrammas pandas. Jūs varat izmantot nejauši ģenerētus datus NumPy bibliotēkā vai datus no CSV faila, lai ģenerētu lodziņa diagrammu pandas.
1. piemērs: lodziņu diagrammas, pamatojoties uz nejaušām vērtībām
Šajā lodziņā redzamie lodziņi ir ģenerēti, izmantojot NumPy un pandas. NumPy bibliotēka tiek izmantota skriptā, lai izveidotu datu ietvara objektu, ģenerējot nejaušo vērtību divdimensiju masīvu, kas satur 5 rindas un 5 kolonnas. Datu rāmja saturs tiks izdrukāts, izmantojot galva() metodi. Tālāk lodziņš () metodi izmanto, lai izveidotu lodziņu diagrammas ar zilu krāsu, fonta lielumu 10 un 30 grādu rotācijas leņķi kolonnu vērtību parādīšanai.
#!/ usr / bin / env python3# Importēt pandas bibliotēku
importa pandas kā pd
# Importējiet NumPy bibliotēku, lai izveidotu masīva nejaušus skaitļus
importēt numpy kā np
"
Ģenerēt datu kopu, pamatojoties uz nejauši izveidotu NumPy masīvu
un piecu kolonnu vērtības
"
datu ietvars = pd.DataFrame (np.nejaušs.randns (5,5), kolonnas = ['2016', '2017', '2018',
“2019”, “2020”])
# Izdrukājiet datu ietvara vērtības
drukāt (datu ietvars.galva ())
# Parādīt lodziņa diagrammu, pamatojoties uz datu ietvara vērtībām
datu ietvars.boxplot (režģis = 'false', color = 'blue', fontsize = 10, rot = 30)
Rezultāts
Pēc koda izpildes parādīsies šāda izeja.
2. piemērs: lodziņu diagrammas, kuru pamatā ir CSV dati
Šajā lodziņā redzamie lodziņi tika ģenerēti no CSV datiem. Izveidojiet CSV failu ar nosaukumu banka.csv izmantojot šādus datus.
banka.csv
SL, klienta_nosaukums, konta tips, dzimums, atlikums1, Marija Ernandesa, taupīšana, sieviete, 120000
2, Mērija Smita, Pašreizējā, Sieviete, 40000
3, Deivids Smits, pašreizējais, vīrietis, 379000
4, Marija Rodrigesa, taupīšana, sieviete, 56000
5, Marks Lī, glābējs, vīrietis, 93500
6, Džonatans Bings, pašreizējais, vīrietis, 5900
7, Daniels Viljamss, Savings, vīrietis, 2300
8, Maiks Brauns, Pašreizējais, Vīrietis, 124888
9, Pols Smits, pašreizējais, vīrietis, 59450
10, Marija Lopesa, taupīšana, sieviete, 487600
Šajā rakstā matplotlib bibliotēka tika izmantota, lai iestatītu lodziņa diagrammas figūras lielumu un parādītu izvades rindu. Visi. Ieraksti banka.csv fails tika ielādēts, izmantojot lasīt_csv () metode pandas. Pēc tam pirmie 8 datu rāmja ieraksti tika izdrukāti, izmantojot galva () metodi. The lodziņš () metode tika izmantota šajā paziņojumā, lai uzzīmētu lodziņa diagrammas attēlu, izmantojot sarkanu krāsu, pamatojoties uz 'Konta tips' ar kolonnu ar nosaukumu “Līdzsvars."
#!/ usr / bin / env python3# Importējiet pandas, lai ģenerētu lodziņu
importa pandas kā pd
# Importējiet matplotlib, lai iestatītu lodziņa diagrammas figūras lielumu
importa matplotlib.pyplot kā plt
# Importējiet get_ipython, lai formatētu izvades rindu
no IPython importa get_ipython
get_ipython ().run_line_magic ('matplotlib', 'iekļauts')
# Iestatiet figūras lielumu
plt.rcParams ['figūra.figsize '] = (8,4)
# Ielādējiet datu kopu no CSV faila
df = pd.lasīt_csv ("banka.csv ")
# Izdrukājiet pirmās 8 ielādēto datu rindas
izdruka (df.galva (8))
# Parādīt lodziņu diagrammas, pamatojoties uz izmantoto parametru
df.boxplot (pēc = 'Account_Type', režģis = 'True', kolonna = ['Bilance'], color = 'red')
Rezultāts
Pēc koda izpildes parādīsies šāda izeja.
Kastīti ar jūras dzimušajiem
Vēl viena Python bibliotēka, ko parasti izmanto lodziņu uzzīmēšanai, ir bibliotēka jūras dzimis. Viena no svarīgām šīs bibliotēkas iezīmēm ir tā, ka tajā ir daudz iebūvētu datu kopu paraugu, lai pārbaudītu dažādus uzdevumus. Nākamie divi piemēri aptvers divu dažādu paraugu datu kopu izmantošanu lodziņu diagrammu zīmēšanai, izmantojot jūras dzimis bibliotēka.
3. piemērs: lodziņu diagrammas, pamatojoties uz parametru x
Šajā piemērā tiek izmantots datu kopas paraugs “dimanti, ” no jūras dzimušais bibliotēku, lai ģenerētu kastes gabalu. Šeit režģa stils tiek definēts, izmantojot set_style () metodi. The load_dataset () metodi izmanto, lai ielādētu datusdimanti datu kopa. Pirmie pieci ieraksti tiek izdrukāti no datu kopas un lodziņš () metodi izmanto, lai uzzīmētu lodziņa diagrammu, pamatojoties uz kolonnu ar nosaukumu 'dziļums,'ar zilu krāsu.
# Importējiet dzimušo bibliotēku, lai izveidotu lodziņuievest jūras dzimušus kā sns
# Importējiet matplotlib, lai iestatītu lodziņa diagrammas figūras lielumu
importa matplotlib.pyplot kā plt
# Importējiet get_ipython, lai formatētu izvades rindu
no IPython importēt get_ipython
get_ipython ().run_line_magic ('matplotlib', 'iekļauts')
# Iestatiet režģa stilu
sns.set_style ("whitegrid")
# Iestatiet figūras lielumu
plt.rcParams ['figūra.figsize '] = (8,4)
# Ielādējiet datu kopas paraugu
dimanta_datu kopa = sns.load_dataset ('dimanti')
# Parādiet pirmos 5 datu kopas ierakstus
drukāt (dimanta_datu kopa.galva ())
# Uzzīmējiet lodziņa diagrammu attēlu
sns.boxplot (x = dimanta_datu kopa ['dziļums'], krāsa = 'zils')
Rezultāts
Pēc koda izpildes parādīsies šāda izeja.
4. piemērs: lodziņu diagrammas, pamatojoties uz x un y parametriem
Šajā piemērā tiek izmantota parauga datu kopa ar nosaukumulidojumi', lai uzzīmētu kastes sižetu. Šeit gan x, gan y parametri lodziņš () metodi izmanto, lai uzzīmētu skaitli. Pārējie apgalvojumi ir līdzīgi iepriekšējam piemēram.
# Importējiet dzimušo bibliotēku, lai izveidotu lodziņuievest jūras dzimušus kā sns
# Importējiet matplotlib, lai iestatītu lodziņa diagrammas figūras lielumu
importa matplotlib.pyplot kā plt
# Importējiet get_ipython, lai formatētu izvades rindu
no IPython importa get_ipython
get_ipython ().run_line_magic ('matplotlib', 'iekļauts')
# Iestatiet režģa stilu
sns.set_style ("darkgrid")
# Iestatiet figūras lielumu
plt.rcParams ['figūra.figsize '] = (12,4)
# Ielādējiet datu kopas paraugu
flight_dataset = sns.load_dataset ('lidojumi')
# Parādiet pirmos 5 datu kopas ierakstus
drukāt (lidojuma_datu kopa.galva ())
# Uzzīmējiet lodziņa diagrammu attēlu
sns.boxplot (x = 'mēnesis', y = 'pasažieri', dati = lidojuma_datu kopa, krāsa = 'zils')
Rezultāts
Pēc koda izpildes parādīsies šāda izeja.
Secinājums
Strādājot ar lielu datu apjomu, ieteicams apkopot datus, izmantojot diagrammu, piemēram, lodziņa diagrammu. Šajā apmācībā tika izmantoti vairāki piemēri, lai parādītu, kā ģenerēt lodziņu diagrammas ar divām Python bibliotēkām.