Datu zinātne

Python Plotly apmācība

Python Plotly apmācība
Plotly ir analīzes uzņēmums, kas pazīstams ar reāllaika analīzes, statistikas un grafisko rīku izstrādi tīmekļa lietojumprogrammām un atsevišķiem Python skriptiem. Šajā nodarbībā mēs aplūkosim pamatplānus ar Plotly un izveidosim vienkāršus un intuitīvus laika rindu datu grafikus, kas pēc būtības būs 100% interaktīvi un tomēr viegli noformējami. Šos grafikus var izmantot prezentācijās, jo tie ir pilnībā interaktīvi un gatavi spēlēt.

Ir arī iespēja saglabāt diagrammas dizainu bezsaistē, lai tos varētu viegli eksportēt. Ir daudzas citas funkcijas, kas ļoti atvieglo bibliotēkas izmantošanu:

Lai sāktu izmantot Plotly pakotni, mums jāreģistrējas kontam iepriekš minētajā vietnē, lai iegūtu derīgu lietotājvārdu un API atslēgu, ar kuru mēs varam sākt izmantot tās funkcijas. Par laimi, Plotly ir pieejams bezmaksas cenu plāns, ar kuru mēs iegūstam pietiekami daudz iespēju, lai izveidotu ražošanas līmeņa diagrammas.

Instalēšana Plotly

Pirms sākat tikai piezīmi, šajā nodarbībā varat izmantot virtuālo vidi, kuru mēs varam izveidot ar šādu komandu:

pitons -m virtualenv sižetiski
avota numpy / bin / aktivizēt

Kad virtuālā vide ir aktīva, varat instalēt Plotly bibliotēku virtuālajā env, lai varētu izpildīt nākamos veidotos piemērus:

pip instalēt sižetiski

Šajā nodarbībā mēs izmantosim Anaconda un Jupyter. Ja vēlaties to instalēt savā datorā, skatiet nodarbību, kurā aprakstīts “Kā instalēt Anaconda Python uz Ubuntu 18.04 LTS ”un dalieties savās atsauksmēs, ja rodas kādas problēmas. Lai instalētu Plotly kopā ar Anaconda, terminālā no Anaconda izmantojiet šādu komandu:

conda instalēt -c plotly plotly

Izpildot iepriekš minēto komandu, mēs redzam kaut ko līdzīgu:

Kad visas nepieciešamās pakotnes ir instalētas un veiktas, mēs varam sākt izmantot bibliotēkas Plotly lietošanu ar šādu importēšanas paziņojumu:

importēt plāni

Kad esat izveidojis kontu vietnē Plotly, jums būs nepieciešamas divas lietas - konta lietotājvārds un API atslēga. Katram kontam var būt tikai viena API atslēga. Tāpēc glabājiet to kaut kur droši, it kā to pazaudētu, jums būs jāatjauno atslēga, un visas vecās lietojumprogrammas, kurās tiek izmantota vecā atslēga, vairs nedarbosies.

Lai sāktu darbu ar Plotly, visās jūsu rakstītajās Python programmās miniet akreditācijas datus šādi:

sižetiski.instrumenti.set_credentials_file (lietotājvārds = 'lietotājvārds', api_key = 'jūsu-api-atslēga')

Sāksim ar šo bibliotēku tūlīt.

Darba sākšana ar Plotly

Mēs savā programmā izmantosim šādus importus:

importa pandas kā pd
importēt numpy kā np
importa scipy kā sp
importēt plāni.sižetiski kā py

Mēs izmantojam:

Dažos piemēros mēs izmantosim paša Plotly datu kopas, kas pieejamas vietnē Github. Visbeidzot, lūdzu, ņemiet vērā, ka bezsaistes režīmu varat iespējot arī Plotly, ja jums ir jāpalaiž Plotly skripti bez tīkla savienojuma:

importa pandas kā pd
importēt numpy kā np
importa scipy kā sp
importēt plāni
sižetiski.bezsaistē.init_notebook_mode (savienots = True)
importēt plāni.bezsaistē kā py

Lai pārbaudītu Plotly instalēšanu, varat palaist šo paziņojumu:

drukāt (sižetiski.__versija__)

Izpildot iepriekš minēto komandu, mēs redzam kaut ko līdzīgu:

Mēs beidzot lejupielādēsim datu kopu ar Pandas un vizualizēsim to kā tabulu:

importēt plāni.figūra_fabrika kā ff
df = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master / school_
ieņēmumi.csv ")
tabula = ff.izveidot_tabulu (df)
py.iplot (tabula, faila nosaukums = 'tabula')

Izpildot iepriekš minēto komandu, mēs redzam kaut ko līdzīgu:

Tagad izveidosim a Joslu diagramma lai vizualizētu datus:

importēt plāni.graph_objs kā iet
dati = [iet.Josla (x = df.Skola, y = df.Sievietes)]
py.iplot (dati, faila nosaukums = 'sieviešu josla')

Mēs redzam kaut ko līdzīgu, izpildot iepriekš minēto koda fragmentu:

Kad redzat iepriekš redzamo diagrammu ar Jupyter piezīmjdatoru, jums tiks piedāvātas dažādas tuvināšanas / tālināšanas iespējas noteiktā diagrammas sadaļā, Box & Lasso izvēle un daudz kas cits.

Grupētas joslu diagrammas

Vairākas joslu diagrammas var viegli grupēt salīdzināšanas nolūkos ar Plotly. Izmantosim to pašu datu kopu un parādīsim vīriešu un sieviešu klātbūtnes atšķirības universitātēs:

sievietes = iet.Josla (x = df.Skola, y = df.Sievietes)
vīrieši = iet.Josla (x = df.Skola, y = df.Vīrieši)
dati = [vīrieši, sievietes]
izkārtojums = iet.Izkārtojums (barmode = "grupa")
fig = iet.Attēls (dati = dati, izkārtojums = izkārtojums)
py.iplot (att.)

Mēs redzam kaut ko līdzīgu, izpildot iepriekš minēto koda fragmentu:

Lai gan tas izskatās labi, etiķetes augšējā labajā stūrī nav pareizas! Labosim tos:

sievietes = iet.Josla (x = df.Skola, y = df.Sievietes, vārds = "Sievietes")
vīrieši = iet.Josla (x = df.Skola, y = df.Vīrieši, vārds = "Vīrieši")

Tagad diagramma izskatās daudz aprakstošāka:

Mēģināsim nomainīt barmodu:

izkārtojums = iet.Izkārtojums (barmode = "relatīvais")
fig = iet.Attēls (dati = dati, izkārtojums = izkārtojums)
py.iplot (att.)

Mēs redzam kaut ko līdzīgu, izpildot iepriekš minēto koda fragmentu:

Pīrāgu diagrammas ar Plotly

Tagad mēs mēģināsim ar Plotly izveidot sektoru diagrammu, kas nosaka pamata atšķirību starp sieviešu procentuālo attiecību visās universitātēs. Universitāšu nosaukums būs etiķetes, un faktiskie skaitļi tiks izmantoti, lai aprēķinātu kopuma procentuālo daudzumu. Šeit ir koda fragments tam pašam:

izsekot = iet.Pīrāgs (etiķetes = df.Skola, vērtības = df.Sievietes)
py.iplot ([izsekot], faila nosaukums = 'pie')

Mēs redzam kaut ko līdzīgu, izpildot iepriekš minēto koda fragmentu:

Laba lieta ir tā, ka Plotly ir aprīkots ar daudzām pietuvināšanas un tālināšanas funkcijām un daudziem citiem rīkiem, lai mijiedarbotos ar izveidoto diagrammu.

Laika rindu datu vizualizācija ar Plotly

Laika rindu datu vizualizēšana ir viens no vissvarīgākajiem uzdevumiem, kas rodas, kad esat datu analītiķis vai inženieris.

Šajā piemērā mēs izmantosim atsevišķu datu kopu tajā pašā GitHub repozitorijā, jo iepriekšējie dati nebija saistīti ar laika zīmoga datiem. Tāpat kā šeit, mēs laika gaitā uzzīmēsim Apple tirgus krājumu variācijas:

finanšu = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master /
finanses-diagrammas-ābols.csv ")
dati = [iet.Izkliede (x = finanšu.Datums, y = finanšu ['AAPL.Aizvērt '])]
py.iplot (dati)

Mēs redzam kaut ko līdzīgu, izpildot iepriekš minēto koda fragmentu:

Kad kursors ir novietots virs diagrammas variācijas līnijas, varat norādīt detalizētu informāciju par punktiem:

Mēs varam izmantot pietuvināšanas un tālināšanas pogas, lai redzētu arī datus, kas raksturīgi katrai nedēļai.

OHLC diagramma

OHLC (Open High Low close close) diagramma tiek izmantota, lai parādītu entītijas variācijas laika posmā. To ir viegli izveidot ar PyPlot:

no datetime importa datetime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
augsti_dati = [33.1, 36.3, 33.6, 33.2, 34.8]
zemi_dati = [32.7, 32.7, 32.8, 32.6, 32.8]
aizvērt_dati = [33.0, 32.9, 33.3, 33.1, 33.1]
datumi = [datuma laiks (gads = 2013, mēnesis = 10, diena = 10),
datuma laiks (gads = 2013, mēnesis = 11, diena = 10),
datuma laiks (gads = 2013, mēnesis = 12, diena = 10),
datuma laiks (gads = 2014, mēnesis = 1, diena = 10),
datuma laiks (gads = 2014, mēnesis = 2, diena = 10)]
izsekot = iet.Ohlc (x = datumi,
atvērts = atvērts_dati,
augsts = augsts_dati,
zems = zems_dati,
aizvērt = aizvērt_dati)
dati = [izsekot]
py.iplot (dati)

Šeit mēs esam snieguši dažus datu punktu paraugus, kurus var secināt šādi:

Tagad palaidīsim iepriekš sniegto koda fragmentu. Mēs redzam kaut ko līdzīgu, izpildot iepriekš minēto koda fragmentu:

Tas ir lielisks salīdzinājums tam, kā noteikt subjekta laika salīdzinājumu ar savu un salīdzināt to ar tā augstajiem un zemajiem sasniegumiem.

Secinājums

Šajā nodarbībā mēs apskatījām citu vizualizācijas bibliotēku Plotly, kas ir lieliska alternatīva Matplotlib ražošanas pakāpes lietojumprogrammās, kuras tiek eksponētas kā tīmekļa lietojumprogrammas, Plotly ir ļoti dinamiska un funkcijām bagāta bibliotēka, ko izmantot ražošanas vajadzībām, tāpēc tas noteikti ir prasme, kas mums vajadzīga zem jostas.

Github vietnē atrodiet visu šajā nodarbībā izmantoto avota kodu. Lūdzu, dalieties savās atsauksmēs par nodarbību Twitter vietnē @sbmaggarwal un @LinuxHint.

Instalējiet jaunāko OpenRA stratēģijas spēli Ubuntu Linux
OpenRA ir bezmaksas / bezmaksas reāllaika stratēģijas spēļu dzinējs, kas atjauno agrīnās Vestvudas spēles, piemēram, klasisko Command & Conquer: Red A...
Instalējiet jaunāko Dolphin emulatoru Gamecube un Wii operētājsistēmai Linux
Delfīnu emulators ļauj jums spēlēt izvēlētās Gamecube un Wii spēles Linux personālajos datoros (PC). Tā kā Dolphin Emulator ir brīvi pieejams un atvē...
Kā lietot GameConqueror Cheat Engine Linux
Rakstā ir sniegts ceļvedis par GameConqueror apkrāptu dzinēja izmantošanu Linux. Daudzi lietotāji, kas spēlē spēles operētājsistēmā Windows, bieži izm...