Šajā rakstā tiks apspriesti daži vietnes pārmeklēšanas veidi, tostarp rīki tīmekļa pārmeklēšanai un to, kā izmantot šos rīkus dažādām funkcijām. Šajā rakstā aplūkotie rīki ietver:
- HTTrack
- Cyotek WebCopy
- Satura mantrausis
- ParseHub
- OutWit Hub
HTTrack
HTTrack ir bezmaksas un atvērtā pirmkoda programmatūra, ko izmanto, lai lejupielādētu datus no vietnēm internetā. Tā ir viegli lietojama programmatūra, kuru izstrādājis Ksavjers Roče. Lejupielādētie dati vietnē localhost tiek glabāti tādā pašā struktūrā kā sākotnējā vietnē. Šīs utilītas izmantošanas procedūra ir šāda:
Vispirms instalējiet HTTrack savā datorā, izpildot šādu komandu:
[aizsargāts pa e-pastu]: ~ $ sudo apt-get install httrackPēc programmatūras instalēšanas palaidiet šo komandu, lai pārmeklētu vietni. Šajā piemērā mēs pārmeklēsim linuxhint.com:
[e-pasts aizsargāts]: ~ $ httrack http: // www.linuxhint.com -o ./Iepriekš minētā komanda ielādēs visus datus no vietnes un saglabās tos pašreizējā direktorijā. Šajā attēlā ir aprakstīts, kā izmantot httrack:
No attēla mēs varam redzēt, ka dati no vietnes ir iegūti un saglabāti pašreizējā direktorijā.
Cyotek WebCopy
Cyotek WebCopy ir bezmaksas tīmekļa pārmeklēšanas programmatūra, ko izmanto, lai kopētu saturu no vietnes vietnei. Pēc programmas palaišanas un vietnes saites un mērķa mapes nodrošināšanas visa vietne tiks kopēta no norādītā URL un saglabāta vietējā mitinātājā. Lejupielādēt Cyotek WebCopy no šīs saites:
https: // www.cyotek.com / cyotek-webcopy / downloads
Pēc instalēšanas, palaižot tīmekļa rāpuļprogrammu, parādīsies zemāk redzamais logs:
Ievadot vietnes URL un nepieciešamajos laukos norādot mērķa mapi, noklikšķiniet uz kopēt, lai sāktu datu kopēšanu no vietnes, kā parādīts zemāk:
Pēc datu kopēšanas no vietnes pārbaudiet, vai dati ir nokopēti galamērķa direktorijā šādi:
Iepriekš redzamajā attēlā visi vietnes dati ir nokopēti un saglabāti mērķa vietā.
Satura mantrausis
Content Grabber ir mākoņdatošanas programmatūra, kuru izmanto, lai iegūtu datus no vietnes. Tas var iegūt datus no jebkuras vairāku struktūru vietnes. Satura grabberu varat lejupielādēt no šīs saites
http: // www.tucows.com / preview / 1601497 / Content-Grabber
Pēc programmas instalēšanas un palaišanas parādās logs, kā parādīts nākamajā attēlā:
Ievadiet tās vietnes URL, no kuras vēlaties iegūt datus. Pēc vietnes URL ievadīšanas atlasiet elementu, kuru vēlaties kopēt, kā parādīts zemāk:
Pēc nepieciešamā elementa izvēles sāciet kopēt datus no vietnes. Tam vajadzētu izskatīties kā šāds attēls:
No vietnes iegūtie dati pēc noklusējuma tiks saglabāti šādā vietā:
C: \ Users \ lietotājvārds \ Document \ Content GrabberParseHub
ParseHub ir bezmaksas un ērti lietojams tīmekļa pārmeklēšanas rīks. Šī programma var kopēt attēlus, tekstu un cita veida datus no vietnes. Lai lejupielādētu ParseHub, noklikšķiniet uz šīs saites:
https: // www.parsehub.com / quickstart
Pēc ParseHub lejupielādes un instalēšanas palaidiet programmu. Parādīsies logs, kā parādīts zemāk:
Noklikšķiniet uz “Jauns projekts”, tās vietnes adreses joslā ievadiet URL, no kuras vēlaties iegūt datus, un nospiediet taustiņu Enter. Pēc tam noklikšķiniet uz “Sākt projektu šajā URL.”
Pēc nepieciešamās lapas izvēles kreisajā pusē noklikšķiniet uz “Iegūt datus”, lai pārmeklētu tīmekļa lapu. Parādīsies šāds logs:
Noklikšķiniet uz “Palaist”, un programma pieprasīs datu tipu, kuru vēlaties lejupielādēt. Atlasiet vajadzīgo veidu, un programma pieprasīs mērķa mapi. Visbeidzot, saglabājiet datus galamērķa direktorijā.
OutWit Hub
OutWit Hub ir tīmekļa rāpuļprogramma, ko izmanto, lai iegūtu datus no vietnēm. Šī programma var iegūt attēlus, saites, kontaktus, datus un tekstu no vietnes. Vienīgās nepieciešamās darbības ir vietnes URL ievadīšana un izvilkamā datu veida izvēle. Lejupielādējiet šo programmatūru no šīs saites:
https: // www.pārspēt.com / products / hub /
Pēc programmas instalēšanas un palaišanas parādās šāds logs:
Iepriekš attēlā redzamajā laukā ievadiet vietnes URL un nospiediet taustiņu Enter. Logā tiks parādīta vietne, kā parādīts zemāk:
Kreisajā panelī atlasiet datu veidu, kuru vēlaties iegūt no vietnes. Šis attēls precīzi ilustrē šo procesu:
Tagad atlasiet attēlu, kuru vēlaties saglabāt localhost, un noklikšķiniet uz attēlā atzīmētās eksportēšanas pogas. Programma lūgs galamērķa direktoriju un saglabās datus direktorijā.
Secinājums
Tīmekļa rāpuļprogrammas tiek izmantotas, lai iegūtu datus no vietnēm. Šajā rakstā tika apspriesti daži tīmekļa pārmeklēšanas rīki un to izmantošana. Katra tīmekļa rāpuļa izmantošana tika apspriesta soli pa solim, kur nepieciešams. Es ceru, ka pēc šī raksta izlasīšanas jums būs viegli izmantot šos rīkus, lai pārmeklētu vietni.