Šajā rakstā es jums parādīšu, kā iegūt pašreizējo pārlūkprogrammas URL, izmantojot Selenium. Tātad, sāksim darbu.
Priekšnosacījumi:
Lai izmēģinātu šī raksta komandas un piemērus, jums ir jābūt,
1) Linux izplatīšana (vēlams, Ubuntu), kas instalēta jūsu datorā.
2) Python 3 instalēts jūsu datorā.
3) PIP 3 instalēts jūsu datorā.
4) pitons virtualenv pakotne instalēta jūsu datorā.
5) datorā instalētas Mozilla Firefox vai Google Chrome tīmekļa pārlūkprogrammas.
6) Jāzina, kā instalēt Firefox Gecko draiveri vai Chrome tīmekļa draiveri.
Lai izpildītu 4., 5. un 6. prasību, lūdzu, izlasiet manu rakstu Iepazīšanās ar selēnu ar Python 3 pie Linuxhint.com.
Vietnē LinuxHint varat atrast daudz rakstu par citām tēmām.com. Noteikti pārbaudiet tos, ja jums nepieciešama palīdzība.
Projektu direktorijas iestatīšana:
Lai viss būtu sakārtots, izveidojiet jaunu projekta direktoriju selēns-url / sekojoši:
$ mkdir -pv selenium-url / draiveri
Pārejiet uz selēns-url / projekta direktoriju šādi:
$ cd selēna-url /
Izveidojiet Python virtuālo vidi projekta direktorijā šādi:
$ virtualenv .venv
Aktivizējiet virtuālo vidi šādi:
$ avots .venv / bin / aktivizēt
Instalējiet Selenium Python bibliotēku virtuālajā vidē, izmantojot PIP3, šādi:
$ pip3 instalējiet selēnu
Lejupielādējiet un instalējiet visus nepieciešamos tīmekļa draiverus vadītāji / projekta direktoriju. Es savā rakstā esmu izskaidrojis tīmekļa draiveru lejupielādes un instalēšanas procesu Iepazīšanās ar selēnu ar Python 3. Ja jums nepieciešama palīdzība, meklējiet vietnē LinuxHint.com par to rakstu.
Šajā rakstā sniegtajai demonstrācijai es izmantoju Google Chrome tīmekļa pārlūku. Tātad, es izmantošu hromedriver binārs ar selēnu. Jums vajadzētu izmantot geckodriver binārs, ja vēlaties izmantot Firefox tīmekļa pārlūkprogrammu.
Pašreizējā URL iegūšana ar selēnu:
Izveidojiet Python skriptu ex01.py projekta direktorijā un ierakstiet tajā sekojošās kodu rindas.
no selēna importa tīmekļa draiverano selēna.tīmekļa draiveris.bieži.atslēgu importēšana
opcijas = tīmekļa draiveris.Chrome opcijas ()
iespējas.bez galvas = patiess
pārlūks = tīmekļa draiveris.Chrome (izpildāmā_ceļš = "./ draiveri / chromedriver ", opcijas = opcijas)
pārlūku.get ("https: // duckduckgo.com / ")
drukāt (pārlūks.pašreizējais_url)
pārlūku.aizvērt ()
Kad esat pabeidzis, saglabājiet ex01.py Python skripts.
Šeit 1. un 2. rinda importē visus nepieciešamos komponentus no Python selēna bibliotēkas.
4. rindā tiek izveidots objekts Chrome opcijas, bet 5. rindā tiek iespējots režīms bez galvas pārlūkam Chrome.
7. rindiņa izveido Chrome pārlūku objektu, izmantojot hromedriver binārs no vadītāji / projekta direktoriju.
9. rinda pārlūkprogrammai liek ielādēt duckduckgo.com vietne.
10. rindā tiek izdrukāts pašreizējais pārlūka URL. Šeit, pārlūku.current_url rekvizīts tiek izmantots, lai piekļūtu pārlūkprogrammas pašreizējam URL.
12. rindiņa aizver pārlūku.
Palaidiet Python skriptu ex01.py sekojoši:
$ python3 ex01.py
Kā redzat, pašreizējais URL (https: // duckduckgo.com) ir iespiests konsolē.
Iepriekšējā piemērā esmu apmeklējis vietni duckduckgo.com un konsolē izdrukāja pašreizējo URL. Tas atgriež apmeklētās lapas URL. Nav ļoti izdomāts, jo mēs jau zinām lapas URL. Tagad meklēsim kaut ko vietnē DuckDuckGo un mēģināsim konsolē izdrukāt meklēšanas rezultātu lapas URL.
Izveidojiet Python skriptu ex02.py projekta direktorijā un ierakstiet tajā sekojošās kodu rindas.
no selēna importa tīmekļa draiverano selēna.tīmekļa draiveris.bieži.atslēgu importēšana
opcijas = tīmekļa draiveris.Chrome opcijas ()
iespējas.bez galvas = patiess
pārlūks = tīmekļa draiveris.Chrome (izpildāmā_ceļš = "./ draiveri / chromedriver ", opcijas = opcijas)
pārlūku.get ("https: // duckduckgo.com / ")
drukāt (pārlūks.pašreizējais_url)
searchInput = pārlūks.find_element_by_id ('search_form_input_homepage')
searchInput.send_keys ('selēns hq' + atslēgas.IEVADIET)
drukāt (pārlūks.pašreizējais_url)
pārlūku.aizvērt ()
Kad esat pabeidzis, saglabājiet ex02.py Python skripts.
Šeit 1. – 10. Rinda ir tāda pati kā rindā ex01.py. Tātad, es tos vairs nepaskaidroju.
12. Rinda atrod meklēšanas tekstlodziņu un saglabā to searchInput mainīgais.
13. rindiņa nosūta meklēšanas vaicājumu selēns hq iekš searchInput tekstlodziņu un nospiež
Kad meklēšanas lapa ir ielādēta, pārlūku.current_url tiek izmantots, lai piekļūtu atjauninātajam pašreizējam URL.
15. rindā konsolē tiek drukāts atjauninātais pašreizējais URL.
17. rindiņa aizver pārlūku.
Palaidiet ex02.py Python skripts šādi:
$ python3 ex02.py
Kā redzat, Python skripts ex02.py izdrukā 2 vietrāžus URL.
Pirmais ir DuckDuckGo meklētājprogrammas sākumlapas URL.
Otrais ir atjaunināts pašreizējais URL pēc meklēšanas veikšanas meklētājprogrammā DuckDuckGo, izmantojot vaicājumu selēns hq.
Secinājums:
Šajā rakstā es jums parādīju, kā iegūt tīmekļa pārlūkprogrammas pašreizējo URL, izmantojot Selenium Python bibliotēku. Tagad jums vajadzētu būt iespējai padarīt savus Selēna projektus interesantākus.