Datu zinātne

Top 10 mašīnmācīšanās bibliotēkas Python

Top 10 mašīnmācīšanās bibliotēkas Python

Ko jūs vēlaties izveidot? Svarīgs jautājums!

Jūs esat ieradies šeit, lai izmantotu mašīnmācīšanos (ML) . Vai esat rūpīgi apsvēris, par ko? Izvēloties Mašīnmācīšanās bibliotēku, jums jāsāk ar to, kā jūs to izmantosit. Pat ja jūs vienkārši interesē mācīšanās, jums vajadzētu apsvērt, kur tiek izmantota mašīnmācība un kas ir vistuvāk jūsu galvenajām interesēm. Jums vajadzētu apsvērt arī to, vai vēlaties koncentrēties uz kaut kā panākšanu vietējā mašīnā vai ja jūs interesē izplatīt skaitļošanu daudzos serveros.

Sākumā sāciet ar to, ka kaut kas darbojas.

Kur tiek izmantota mašīnmācīšanās

Jūs varat atrast daudzus projektus, kas izmanto ML, patiesībā tik daudz, ka katra kategorija ir lappuses gara. Īsā versija ir “visur”, tā nav taisnība, bet jāsāk domāt. Acīmredzami ir ieteikumu dzinēji, attēlu atpazīšana un surogātpasta noteikšana. Tā kā jūs jau programmējat Python, jūs interesēs arī The Kite koda pabeigšanas programmatūra. Šis ir Citi lietojumi, lai atklātu kļūdas, kas saistītas ar manuālu datu ievadīšanu, medicīnisko diagnostiku un apkopi lielākajās rūpnīcās un citās nozarēs

Bibliotēkas īsumā:

  1. Scikit-mācīties, No scikit; Rutīnas un bibliotēkas virs NumPy, SciPy un Matplotlib. Šī bibliotēka tieši paļaujas uz Python vietējo matemātisko bibliotēku kārtību. Jūs instalējat scikit-learn ar parasto Python pakotņu pārvaldnieku. Scikit-learn ir mazs un neatbalsta GPU aprēķinus, tas var likt jums, bet tā ir apzināta izvēle. Šī pakete ir mazāka, un ar to ir vieglāk sākt strādāt. Tas joprojām darbojas diezgan labi lielākos apstākļos, lai gan, lai izveidotu gigantisku aprēķinu kopu, jums ir nepieciešamas citas paketes.
  2. Scikit-attēls Īpašs attēliem! Scikit-image ir attēlu analīzes un manipulācijas algoritmi. To var izmantot, lai labotu bojātus attēlus, kā arī manipulētu ar krāsu un citiem attēla atribūtiem. Šīs paketes galvenā ideja ir padarīt visus attēlus pieejamus NumPy, lai jūs varētu veikt darbības ar tiem kā ndarrays. Tādā veidā attēli ir pieejami kā dati jebkuru algoritmu darbināšanai.
  3. Šoguns: C ++ bāze ar skaidrām API saskarnēm Python, Java, Scala utt. Daudzi, varbūt lielākā daļa eksperimentēšanai pieejamo algoritmu. Šis ir rakstīts C ++ efektivitātes dēļ, ir arī veids, kā to izmēģināt mākonī. Šoguns izmanto SWIG, lai sazinātos ar daudzām programmēšanas valodām, ieskaitot Python. Šoguns aptver lielāko daļu algoritmu un tiek plaši izmantots akadēmiskajā pasaulē. Pakotnei ir rīkkaste, kas pieejama vietnē https: // www.shogun-toolbox.org.
  4. Spark MLlib: Galvenokārt paredzēts Java, taču tas ir pieejams caur NumPy bibliotēku Python izstrādātājiem. Spark MLlib ir izstrādājusi Apache komanda, tāpēc tas ir paredzēts izplatītām skaitļošanas vidēm, un tas ir jāvada kopā ar kapteini un darbiniekiem. To var izdarīt atsevišķā režīmā, bet Spark reālā jauda ir spēja sadalīt darbus daudzās mašīnās. Spark izplatītais raksturs padara to populāru daudzu lielu uzņēmumu, piemēram, IBM, Amazon un Netflix. Galvenais mērķis ir iegūt “Big Data”, kas nozīmē visas tās rīvmaizes, kuras jūs atstājat, sērfojot un iepērkoties tiešsaistē. Ja vēlaties strādāt ar mašīnmācīšanos, Spark MLlib ir laba vieta, kur sākt. Algoritmi, kurus tā atbalsta, ir sadalīti visā diapazonā. Ja sākat hobija projektu, tā var nebūt labākā ideja.
  5. H2O: Ir vērsts uz biznesa procesiem, tāpēc atbalsta ieteikumu un krāpšanas novēršanas prognozes. Bizness, H20.ai mērķis ir atrast un analizēt datu kopas no izplatītām failu sistēmām. To var palaist lielākajā daļā parasto operētājsistēmu, taču galvenais mērķis ir atbalstīt mākoņdatošanas sistēmas. Tas ietver lielāko daļu statistikas algoritmu, tāpēc tos var izmantot lielākajai daļai projektu.
  6. Mahout: Ir paredzēts izplatītiem mašīnmācīšanās algoritmiem. Tas ir Apache sastāvdaļa aprēķinu sadalītā rakstura dēļ. Mahout ideja ir matemātiķiem ieviest savus algoritmus. Tas nav paredzēts iesācējiem, ja jūs tikai mācāties, labāk izmantojiet kaut ko citu. To sakot, Mahout var izveidot savienojumu ar daudziem aizmugurējiem galiem, tāpēc, kad esat izveidojis kaut ko, ieskatieties, vai vēlaties izmantot Mahout savai frontend.
  7. Cloudera Oryx: Galvenokārt tiek izmantots mašīnmācībai reāllaika datos. Oryx 2 ir arhitektūra, kas visu darbu slāņo, lai izveidotu sistēmu, kas var reaģēt uz reāllaika datiem. Slāņi darbojas arī dažādos laika periodos, izmantojot pakešu slāni, kas veido pamatmodeli, un ātruma slāni, kas modificē modeli, kad ienāk jauni dati. Oryx ir veidots virs Apache Spark un izveido visu arhitektūru, kas īsteno visas lietojumprogrammas daļas.
  8. Teano: Theano ir Python bibliotēkas, kas ir integrēta ar NumPy. Tas ir vistuvāk Python, kuru varat iegūt. Lietojot Theano, ieteicams instalēt gcc. Iemesls tam ir tāds, ka Theano var apkopot jūsu kodu vispiemērotākajā iespējamajā kodā. Lai gan Python ir lielisks, dažos gadījumos C ir ātrāks. Tātad Theano var pārveidot par C un apkopot, lai jūsu programma darbotos ātrāk. Pēc izvēles varat pievienot GPU atbalstu.
  9. Tensorflow: Nosaukuma tenzors norāda uz matemātisko tenoru. Šādam tenzoram ir n vietas matricā, tomēr tenzors ir daudzdimensionāls masīvs. TensorFlow ir algoritmi, lai veiktu Tensors aprēķinus, tāpēc nosaukums, jūs varat tos izsaukt no Python. Tas ir veidots C un C ++, taču tam ir priekšgals Python. Tas atvieglo tā lietošanu un ātru skriešanu. Tensorflow var darboties CPU, GPU vai izplatīt tīklos, to panāk izpildes dzinējs, kas darbojas kā slānis starp jūsu kodu un procesoru.
  10. Matplotlib: Kad esat izdomājis problēmu, kuru varat atrisināt, izmantojot mašīnmācīšanos, visticamāk, vēlēsities vizualizēt savus rezultātus. Šeit ienāk matplotlib. Tas ir paredzēts, lai parādītu visu matemātisko grafiku vērtības, un tiek ļoti izmantots akadēmiskajā pasaulē.

SECINĀJUMS

Šis raksts ir devis priekšstatu par to, kas ir pieejams programmēšanai mašīnmācībā. Lai iegūtu skaidru priekšstatu par to, kas jums nepieciešams, jums jāsāk, izveidojot dažas programmas un redzot, kā tās darbojas. Kamēr nezināt, kā lietas var izdarīt, jūs varat atrast ideālu risinājumu savam nākamajam projektam.

Kontrolējiet un pārvaldiet peles kustību starp vairākiem monitoriem sistēmā Windows 10
Dual Display Mouse Manager ļauj kontrolēt un konfigurēt peles kustību starp vairākiem monitoriem, palēninot tās kustību robežas tuvumā. Windows 10/8 ļ...
WinMouse ļauj jums pielāgot un uzlabot peles rādītāja kustību Windows datorā
Ja vēlaties uzlabot peles rādītāja noklusējuma funkcijas, izmantojiet bezmaksas programmatūru WinMouse. Tas pievieno vairāk funkciju, kas palīdzēs jum...
Peles kreisā klikšķa poga nedarbojas operētājsistēmā Windows 10
Ja ar klēpjdatoru vai galddatoru izmantojat īpašu peli, bet nedarbojas peles kreisās klikšķa poga kādu iemeslu dēļ operētājsistēmā Windows 10/8/7 šeit...