Co to jest urllib?
urllib to moduł Pythona, którego można używać do otwierania adresów URL. Definiuje funkcje i klasy pomagające w działaniach adresów URL.
Dzięki Pythonowi można również uzyskiwać dostęp do danych z Internetu, takich jak XML, HTML, JSON itp., I pobierać je z nich. Możesz także używać Pythona do bezpośredniej pracy z tymi danymi. W tym samouczku zobaczymy, jak możemy odzyskać dane z sieci. Na przykład użyliśmy tutaj adresu URL wideo guru99 i zamierzamy uzyskać dostęp do tego adresu URL wideo za pomocą Pythona, a także wydrukować plik HTML z tego adresu URL.
W tym samouczku nauczymy się
- Jak otworzyć adres URL za pomocą Urllib
- Jak czytać plik HTML dla swojego adresu URL w Pythonie
Jak otworzyć adres URL za pomocą Urllib
Zanim uruchomimy kod łączący się z danymi internetowymi, musimy zaimportować instrukcję dla modułu biblioteki URL lub "urllib".
- Importuj urllib
- Określ swoją główną funkcję
- Zadeklaruj zmienną webUrl
- Następnie wywołaj funkcję urlopen w bibliotece lib URL
- Adres URL, który otwieramy, to samouczek guru99 na youtube
- Następnie wydrukujemy kod wynikowy
- Kod wynikowy jest pobierany poprzez wywołanie funkcji getcode w utworzonej przez nas zmiennej webUrl
- Zamierzamy przekształcić to w ciąg, aby można go było połączyć z naszym ciągiem „kod wyniku”
- Będzie to zwykły kod HTTP „200”, wskazujący, że żądanie HTTP zostało pomyślnie przetworzone
Jak uzyskać adres URL formularza pliku HTML w Pythonie
Możesz również odczytać plik HTML za pomocą "funkcji odczytu" w Pythonie, a po uruchomieniu kodu plik HTML pojawi się w konsoli.
- Wywołaj funkcję odczytu w zmiennej webURL
- Zmienna Read pozwala na odczytanie zawartości plików danych
- Wczytaj całą zawartość adresu URL do zmiennej o nazwie data
- Uruchom kod - wydrukuje dane w formacie HTML
Oto pełny kod
Przykład Pythona 2
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Przykład Pythona 3
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)