type
status
date
slug
summary
tags
category
icon
password
comment
urllib 概述
urllib 是 Python 的标准库,专注于 URL 处理和 HTTP 请求,是网络编程的基础工具。
urllib.request 模块
urlopen 发送请求
用于打开 url
urllib.request.urlopen(url, data=None, [timeout, ]*, context=None)
class urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)
读取响应信息
response 的类型
<class 'http.client.HTTPResponse'>
字节流转为字符串
HTTPHandler + opener 发送请求
HTTPBasicAuthHandler
用于登录验证
ProxyHandler
用于添加代理
HTTPCookieProcessor
获取 cookie
保存 cookie 到文件中
使用本地 cookie
urllib.parse 模块
urllib.parse.quote(string, safe='/', encoding=None, errors=None)
urllib.parse.urlencode(query, doseq=False, safe='', encoding=None, errors=None, quote_via=quote_plus)
urllib.error 模块
URLError
URLError 类来自 urllib 库的 error 模块,它继承自 OSError 类,是 error 异常模块的基类,由 request 模块产生的异常都可以通过捕获这个类来处理。
有一个属性 reason,即返回错误的原因。
HTTPError
它是 URLError 的子类,专门用来处理 HTTP 请求错误,比如认证请求失败等。
它有如下3 个属性。
code:返回 HTTP 状态码,比如404 表示网页不存在等。
reason:同父类一样,用于返回错误的原因。
headers:返回请求头
实战
豆瓣电影
页面:分类排行榜
需求:获取电影列表
网址:https://movie.douban.com/typerank?type_name=%E7%A7%91%E5%B9%BB&type=17&interval_id=100:90&action=
请求接口:https://movie.douban.com/j/chart/top_list?type=17&interval_id=100%3A90&action=&start=0&limit=20
请求方法:GET
响应类型:json 格式
肯德基官网
页面:肯德基餐厅信息查询
需求:获取城市列表
请求方法:POST
参数列表:cname,pid,pageIndex,pageSize
响应类型:json 格式
淘票票官网
页面:淘票票官网首页
需求:获取城市列表
请求方法:GET
响应类型:json 格式
- 作者:longlong
- 链接:https://long.long-code.cn//article/urllib
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。








