Wat is urllib?
urllib is een Python-module die kan worden gebruikt voor het openen van URL's. Het definieert functies en klassen om te helpen bij URL-acties.
Met Python kunt u ook toegang krijgen tot gegevens van internet en deze ophalen, zoals XML, HTML, JSON, enz. U kunt Python ook gebruiken om rechtstreeks met deze gegevens te werken. In deze tutorial gaan we zien hoe we data van internet kunnen halen. Hier hebben we bijvoorbeeld een guru99-video-URL gebruikt, en we gaan toegang krijgen tot deze video-URL met Python en we printen ook het HTML-bestand van deze URL.
In deze tutorial zullen we leren
- Hoe URL te openen met Urllib
- Hoe u een HTML-bestand voor uw URL in Python leest
Hoe URL te openen met Urllib
Voordat we de code uitvoeren om verbinding te maken met internetgegevens, moeten we de instructie voor de URL-bibliotheekmodule of "urllib" importeren.
- Importeer urllib
- Bepaal uw belangrijkste functie
- Declareer de variabele webUrl
- Roep vervolgens de urlopen-functie aan in de URL lib-bibliotheek
- De URL die we openen is guru99 tutorial op youtube
- Vervolgens gaan we de resultaatcode afdrukken
- De resultaatcode wordt opgehaald door de functie getcode aan te roepen op de webUrl-variabele die we hebben gemaakt
- We gaan dat converteren naar een string, zodat het kan worden samengevoegd met onze string "resultaatcode"
- Dit is een normale HTTP-code "200", waarmee wordt aangegeven dat het http-verzoek met succes is verwerkt
Hoe een HTML-bestandsformulier-URL in Python te krijgen
U kunt het HTML-bestand ook lezen door de "leesfunctie" in Python te gebruiken, en wanneer u de code uitvoert, zal het HTML-bestand in de console verschijnen.
- Roep de leesfunctie op de webURL-variabele aan
- Met de leesvariabele kan de inhoud van gegevensbestanden worden gelezen
- Lees de volledige inhoud van de URL in een variabele met de naam data
- Voer de code uit - Het zal de gegevens in HTML-indeling afdrukken
Hier is de volledige code
Python 2-voorbeeld
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3-voorbeeld
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)