python之web模块学习-- httplib

发布时间:2017-09-12 15:01:43
python之web模块学习-- httplib

httplib 是python中http协议的客户端实现,可以使用该模块来与 HTTP 服务器进行交互

httplib是一个相对底层的http请求模块,其上有专门的包装模块,如urllib内建模块,goto等第三方模块,但是封装的越高就越不灵活,比如urllib模块里请求错误时就不会返回结果页的内容,只有头信息,对于某些需要检测错误请求返回值的场景就不适用,所以就得用这个模块了。

httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的HTTP和HTTPS实现。其中HTTPS需要socket编译了SSL支持。HTTP类仅仅是和python1.5.2及以前的版本兼容,不推荐使用。

2 httplib 详解

下面介绍一下 httplib常用的类

2.1 class httplib.HTTPConnection

HTTPConnection类 有两种常见方式:

1 HTTPConnection

class httplib.HTTPConnection(host[,port[, strict[, timeout[, source_address]]]])

用法:

该类用于创建一个http类型的请求链接

参数:

host: 请求的服务器host,不能带开头

port: 服务器web服务端口

strict: 是否严格检查请求的状态行,就是http1.0/1.1 协议版本的那一行,即请求的第一行,默认为False,为True时检查错误会抛异常

timeout: 单次请求的超时时间,没有时默认使用httplib模块内的全局的超时时间

返回:

HTTPConnection类会实例并返回一个HTTPConnection对象

详解:

HttpConnection的实例表示与HTTP服务器的事务。实例化时需要传递主机和可选的端口号。如果没有端口号,试图以host:port格式从主机字符串提取,如果提取失败则使用默认的HTTP端口(80)。参数strict默认为false,表示在无法解析状态行时(status line)不能被HTTP/1.0或1.1解析时不抛出BadStatusLine异常;可选参数timeout表示即阻塞在多少秒后超时,如果没有给出默认使用全局超时设置。可选参数source_address表示HTTP的源地址(host, port)。

2 HTTPSConnection

class httplib.HTTPSConnection(host[, port[, key_file[,cert_file[, strict[, timeout[, source_address]]]]]])

用法:

该类用于创建一个https类型的请求链接

参数:

key_file:一个包含PEM格式的私钥文件

cert_file:一个包含PEM格式的认证文件

other:其它同http参数

返回:

同样返回一个HTTPSConnection对象

注意:

要创建https链接,必须要保证底层的socket模块是支持ssl的编译模式,即编译时ssl选项的开关是开着的

详解:

HttpConnection的子类,使用SSL与安全服务器通信。默认端口为443。key_file是包含PEM格式私钥的文件名称。 cert_file中是PEM格式的证书链文件。

附代码:

HTTP:

>>> import httplib

>>> conn =httplib.HTTPConnection('')

>>> conn = httplib.HTTPConnection(':80')

>>> conn =httplib.HTTPConnection('','80')

>>> conn =httplib.HTTPConnection('','80',True)

>>> conn =httplib.HTTPConnection('','80',True,10)

错误示例:

>>> conn =httplib.HTTPConnection(':80',True,10)

HTTPS:

>>> conn = httplib.HTTPSConnection('',443,key_file,cert_file,True,10)

以下为 关于 HTTPConnection 类的方法

2.1.1 HTTPConnection.request()

HTTPConnection.request( method , url [ , body [ , headers ]] )

用法:

调用request方法会向服务器发送一次请求

参数:

method: 请求的方式,如'GET','POST','HEAD','PUT','DELETE'等

url: 请求的网页路径。如:'/index.html'

body: 请求是否带数据,该参数是一个字典

headers: 请求是否带头信息,该参数是一个字典,不过键的名字是指定的http头关键字

返回:

无返回,其实就是相对于向服务其发送数据,但是没有最后回车

附代码:

>>> import httplib

>>>conn=httplib.HTTPConnection('',80,False,10)

>>> conn.request('get','/','',{'user-agent':'test'})

2.1.2 HTTPConnection.getresponse()

说明:

获取一个http响应对象,相当于执行最后的2个回车

返回:

HTTPResponse对象(下面会用到)

附代码:

>>> import httplib

>>> conn=httplib.HTTPConnection('',80,False,10)

>>> conn.request('get','/','',{'user-agent':'test'})

>>>res = conn.getresponse()

2.1.3 HTTPConnection.connect()

对象创建之后连接到指定的服务器

2.1.4 HTTPConnection.close()

关闭与服务器的连接

附代码:

>>> import httplib

>>> conn=httplib.HTTPConnection('',80,False,10)

>>> conn.request('get','/','',{'user-agent':'test'})

>>> res = conn.getresponse()

>>>conn.close()

2.1.5 HTTPConnection.set_debuglevel( level )

设置高度的级别。参数level 的默认值为0 ,表示不输出任何调试信息

2.2 class httplib.HTTPResponse

HTTPResponse表示服务器对客户端请求的响应。往往通过调用HTTPConnection.getresponse()来创建,实例连接成功之后返回的类,不能由用户实例化。

它有如下方法和属性:

2.2.1 HTTPResponse.read([amt])

说明:

获得http响应的内容部分,即网页源码

原型:

body = res.read([amt])amt: 读取指定长度的字符,默认为空,即读取所有内容

返回:

网页内容字符串

获取响应的消息体。如果请求的是一个普通的网页,那么该方法返回的是页面的html。可选参数amt表示从响应流中读取指定字节的数据。

附代码:

>>>conn=httplib.HTTPConnection('',80,False,10)

>>> conn.request('GET','')

>>> res = conn.getresponse()

>>>res.read()

#下面的为网页信息

企业建站2800元起,携手武汉肥猫科技,做一个有见地的颜值派!更多优惠请戳:武汉网站开发公司 https://www.feimao666.com


友情链接

独家出品

新闻由机器选取每5分钟自动更新

新闻搜索源于互联网新闻网站和频道,系自动分类排列,本站不刊登或转载任何完整的新闻内容