Hogyan szerezheti meg a jelenlegi URL -t a szelénnel

How Get Current Url With Selenium



A szelén egy eszköz a böngésző teszteléséhez, a webes automatizáláshoz és a webkaparáshoz. A szelénprojekteken dolgozva szükség lehet a Selenium által vezérelt webböngésző által megjelenített oldal URL -címének ismeretére. Ezek az információk hasznosak lehetnek annak az URL -nek a nyomon követéséhez, ahonnan egyes adatokat kinyertek, így bizonyos szkriptek használatával automatikusan frissítheti az adatokat.

Ebben a cikkben megmutatom, hogyan szerezheti be a böngésző aktuális URL -jét a szelénnel. Szóval, kezdjük.







Feltételek:

A cikk parancsainak és példáinak kipróbálásához rendelkeznie kell:



1) Linux disztribúció (lehetőleg Ubuntu) telepítve a számítógépre.
2) Python 3 telepítve a számítógépre.
3) A PIP 3 telepítve van a számítógépre.
4) Python virtualenv csomag telepítve van a számítógépére.
5) Mozilla Firefox vagy Google Chrome webböngészők telepítve a számítógépre.
6) Tudnia kell, hogyan kell telepíteni a Firefox Gecko illesztőprogramot vagy a Chrome webes illesztőprogramot.



A 4., 5. és 6. követelmény teljesítéséhez kérjük, olvassa el cikkemet Bevezetés a szelénbe a Python 3 segítségével a Linuxhint.com oldalon.





A többi témában számos cikket talál LinuxHint.com . Feltétlenül nézze meg őket, ha segítségre van szüksége.

Projektkönyvtár beállítása:

Ha mindent rendben szeretne tartani, hozzon létre egy új projektkönyvtárat szelén-url/ alábbiak szerint:



$mkdir -pvszelén-url/sofőrök

Navigáljon a szelén-url/ projektkönyvtár az alábbiak szerint:

$CDszelén-url/

Hozzon létre egy Python virtuális környezetet a projektkönyvtárban az alábbiak szerint:

$virtualenv .venv

Aktiválja a virtuális környezetet az alábbiak szerint:

$forrás.venv/am/aktiválja

Telepítse a Selenium Python könyvtárat virtuális környezetébe a PIP3 használatával az alábbiak szerint:

$ pip3 telepítse a szelént

Töltse le és telepítse az összes szükséges webes illesztőprogramot a sofőrök/ projekt könyvtára. Cikkemben elmagyaráztam a webes illesztőprogramok letöltésének és telepítésének folyamatát Bevezetés a szelénbe a Python 3 segítségével . Ha segítségre van szüksége, keressen tovább LinuxHint.com ahhoz a cikkhez.

Ebben a cikkben a Google Chrome böngészőt fogom használni. Szóval használni fogom a chromedriver bináris szelénnel. Használnia kell a gekkó sofőr bináris, ha a Firefox webböngészőt szeretné használni.

Hozzon létre egy Python -szkriptet ex01.py a projekt könyvtárában, és írja be a következő kódsorokat.

tól tőlszelénimportwebmeghajtó
tól tőlszelén.webmeghajtó.gyakori.kulcsok importKulcsok
lehetőségek=webmeghajtó.ChromeOptions()
lehetőségek.fejetlen = Igaz
böngésző=webmeghajtó.Króm(futtatható_útvonal='./drivers/chromedriver',lehetőségek=lehetőségek)
böngésző.kap('https://duckduckgo.com/')
nyomtatás(böngésző.aktuális_url)
böngésző.Bezárás()

Ha elkészült, mentse a ex01.py Python szkript.

Itt az 1. és a 2. sor importálja az összes szükséges összetevőt a Python szelénkönyvtárából.

A 4. sor létrehoz egy Chrome -beállítások objektumot, az 5. sor pedig fej nélküli módot tesz lehetővé a Chrome webböngészőben.

A 7. sor létrehoz egy Chrome -ot böngésző objektumot a chromedriver bináris a sofőrök/ projekt könyvtára.

A 9. sor azt mondja a böngészőnek, hogy töltse be a duckduckgo.com webhelyet.

A 10. sor kinyomtatja a böngésző aktuális URL -jét. Itt, browser.current_url tulajdonság a böngésző aktuális URL -jének elérésére szolgál.

A 12. sor bezárja a böngészőt.

Futtassa a Python szkriptet ex01.py alábbiak szerint:

$ python3 ex01.py

Mint látható, a jelenlegi URL ( https://duckduckgo.com ) van nyomtatva a konzolon.

A korábbi példában meglátogattam a duckduckgo.com webhelyet, és kinyomtattam az aktuális URL -t a konzolon. Ez visszaadja a felkeresett oldal URL -jét. Nem túl divatos, mivel már ismerjük az oldal URL -jét. Most keressünk valamit a DuckDuckGo -n, és próbáljuk meg kinyomtatni a keresési eredményoldal URL -jét a konzolon.

Hozzon létre egy Python -szkriptet ex02.py a projekt könyvtárában, és írja be a következő kódsorokat.

tól tőlszelénimportwebmeghajtó
tól tőlszelén.webmeghajtó.gyakori.kulcsok importKulcsok
lehetőségek=webmeghajtó.ChromeOptions()
lehetőségek.fejetlen = Igaz
böngésző=webmeghajtó.Króm(futtatható_útvonal='./drivers/chromedriver',lehetőségek=lehetőségek)
böngésző.kap('https://duckduckgo.com/')
nyomtatás(böngésző.aktuális_url)
searchInput=böngésző.find_element_by_id('search_form_input_homepage')
searchInput.send_keys('szelén hq'+ Kulcsok.BELÉP)
nyomtatás(böngésző.aktuális_url)
böngésző.Bezárás()

Ha elkészült, mentse a ex02.py Python szkript.

Itt az 1-10 sor ugyanaz, mint a ex01.py . Tehát nem magyarázom meg őket újra.

A 12. sor megtalálja a keresési szövegdobozt, és eltárolja a searchInput változó.

A 13. sor küldi a keresési lekérdezést szelén hq ban,-ben searchInput szövegmezőbe, és megnyomja a gombot gomb segítségével Kulcsok.ENTER .

A keresési oldal betöltése után browser.current_url a frissített aktuális URL elérésére szolgál.

A 15. sor kinyomtatja a frissített aktuális URL -t a konzolon.

A 17. sor bezárja a böngészőt.

Futtassa a ex02.py A Python szkriptje a következő:

$ python3 ex02.py

Mint láthatja, a Python szkript ex02.py 2 URL -t nyomtat.

Az első a DuckDuckGo keresőmotor honlapjának URL -je.

A második a frissített aktuális URL, miután a lekérdezés segítségével végzett keresést a DuckDuckGo keresőmotorban szelén hq .

Következtetés:

Ebben a cikkben megmutatom, hogyan szerezheti be a webböngésző aktuális URL -jét a Selenium Python könyvtár használatával. Most képesnek kell lennie arra, hogy érdekesebbé tegye szelén projektjeit.