Python Language
urllib
Szukaj…
HTTP GET
Python 2.x 2.7
Python 2
import urllib
response = urllib.urlopen('http://stackoverflow.com/documentation/')
Użycie urllib.urlopen()
zwróci obiekt odpowiedzi, który może być obsługiwany podobnie do pliku.
print response.code
# Prints: 200
Kod response.code
reprezentuje zwracaną wartość http. 200 to OK, 404 to NotFound itp.
print response.read()
'<!DOCTYPE html>\r\n<html>\r\n<head>\r\n\r\n<title>Documentation - Stack. etc'
response.read()
i response.readlines()
mogą być użyte do odczytu rzeczywistego pliku HTML zwróconego z żądania. Te metody działają podobnie do file.read*
Python 3.x 3.0
Python 3
import urllib.request
print(urllib.request.urlopen("http://stackoverflow.com/documentation/"))
# Prints: <http.client.HTTPResponse at 0x7f37a97e3b00>
response = urllib.request.urlopen("http://stackoverflow.com/documentation/")
print(response.code)
# Prints: 200
print(response.read())
# Prints: b'<!DOCTYPE html>\r\n<html>\r\n<head>\r\n\r\n<title>Documentation - Stack Overflow</title>
Moduł został zaktualizowany do Pythona 3.x, ale przypadki użycia pozostają w zasadzie takie same. urllib.request.urlopen
zwróci podobny obiekt podobny do pliku.
POST HTTP
Aby dane POST przekazać zakodowane argumenty zapytania jako dane do urlopen ()
Python 2.x 2.7
Python 2
import urllib
query_parms = {'username':'stackoverflow', 'password':'me.me'}
encoded_parms = urllib.urlencode(query_parms)
response = urllib.urlopen("https://stackoverflow.com/users/login", encoded_parms)
response.code
# Output: 200
response.read()
# Output: '<!DOCTYPE html>\r\n<html>\r\n<head>\r\n\r\n<title>Log In - Stack Overflow'
Python 3.x 3.0
Python 3
import urllib
query_parms = {'username':'stackoverflow', 'password':'me.me'}
encoded_parms = urllib.parse.urlencode(query_parms).encode('utf-8')
response = urllib.request.urlopen("https://stackoverflow.com/users/login", encoded_parms)
response.code
# Output: 200
response.read()
# Output: b'<!DOCTYPE html>\r\n<html>....etc'
Dekoduj odebrane bajty zgodnie z kodowaniem typu zawartości
Otrzymane bajty muszą zostać zdekodowane przy użyciu prawidłowego kodowania znaków, aby mogły zostać zinterpretowane jako tekst:
Python 3.x 3.0
import urllib.request
response = urllib.request.urlopen("http://stackoverflow.com/")
data = response.read()
encoding = response.info().get_content_charset()
html = data.decode(encoding)
Python 2.x 2.7
import urllib2
response = urllib2.urlopen("http://stackoverflow.com/")
data = response.read()
encoding = response.info().getencoding()
html = data.decode(encoding)
Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow