Dostęp do Internetu w Pythonie przy użyciu Urllib.Request i urlopen ()

Spisie treści:

Anonim

Co to jest urllib?

urllib to moduł Pythona, którego można używać do otwierania adresów URL. Definiuje funkcje i klasy pomagające w działaniach adresów URL.

Dzięki Pythonowi można również uzyskiwać dostęp do danych z Internetu, takich jak XML, HTML, JSON itp., I pobierać je z nich. Możesz także używać Pythona do bezpośredniej pracy z tymi danymi. W tym samouczku zobaczymy, jak możemy odzyskać dane z sieci. Na przykład użyliśmy tutaj adresu URL wideo guru99 i zamierzamy uzyskać dostęp do tego adresu URL wideo za pomocą Pythona, a także wydrukować plik HTML z tego adresu URL.

W tym samouczku nauczymy się

  • Jak otworzyć adres URL za pomocą Urllib
  • Jak czytać plik HTML dla swojego adresu URL w Pythonie

Jak otworzyć adres URL za pomocą Urllib

Zanim uruchomimy kod łączący się z danymi internetowymi, musimy zaimportować instrukcję dla modułu biblioteki URL lub "urllib".

  • Importuj urllib
  • Określ swoją główną funkcję
  • Zadeklaruj zmienną webUrl
  • Następnie wywołaj funkcję urlopen w bibliotece lib URL
  • Adres URL, który otwieramy, to samouczek guru99 na youtube
  • Następnie wydrukujemy kod wynikowy
  • Kod wynikowy jest pobierany poprzez wywołanie funkcji getcode w utworzonej przez nas zmiennej webUrl
  • Zamierzamy przekształcić to w ciąg, aby można go było połączyć z naszym ciągiem „kod wyniku”
  • Będzie to zwykły kod HTTP „200”, wskazujący, że żądanie HTTP zostało pomyślnie przetworzone

Jak uzyskać adres URL formularza pliku HTML w Pythonie

Możesz również odczytać plik HTML za pomocą "funkcji odczytu" w Pythonie, a po uruchomieniu kodu plik HTML pojawi się w konsoli.

  • Wywołaj funkcję odczytu w zmiennej webURL
  • Zmienna Read pozwala na odczytanie zawartości plików danych
  • Wczytaj całą zawartość adresu URL do zmiennej o nazwie data
  • Uruchom kod - wydrukuje dane w formacie HTML

Oto pełny kod

Przykład Pythona 2

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Przykład Pythona 3

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)