当前位置: 首页 > news >正文

建立网站 知乎网页美工设计论文

建立网站 知乎,网页美工设计论文,环保东莞网站建设技术支持,南京好的网站制作公司一、关于中间件 之前文章说过#xff0c;scrapy有两种中间件#xff1a;爬虫中间件和下载中间件#xff0c;他们的作用时间和位置都不一样#xff0c;具体区别如下#xff1a; 爬虫中间件#xff08;Spider Middleware#xff09; 作用#xff1a; 爬虫中间件主要负…一、关于中间件 之前文章说过scrapy有两种中间件爬虫中间件和下载中间件他们的作用时间和位置都不一样具体区别如下 爬虫中间件Spider Middleware 作用 爬虫中间件主要负责处理从引擎发送到爬虫的请求和从爬虫返回到引擎的响应。这些中间件在请求发送给爬虫之前或响应返回给引擎之前可以对它们进行处理。 下载中间件Downloader Middleware 作用 下载中间件主要负责处理引擎发送到下载器的请求和从下载器返回到引擎的响应。这些中间件在请求发送给下载器之前或响应返回给引擎之前可以对它们进行处理。 中间件作用优先级 只需要记住级别越小的越接近scrapy的引擎结合scrapy的数据流就能记住每个中间件的作用时机。 结合图可知 在下载中间件中 对于process_request()来说优先级数字越小越先被调用对于process_response()来说优先级数字越大越先被调用 在爬虫中间件中 对于process_spider_input()来说优先级数字越小越先被调用对于process_spider_output()来说优先级数字越大越先被调用 那么哪来的这些方法 二、定义中间件的通用模板 先看一个内置的中间件UserAgentMiddleware init: 在这里进行中间件的初始化可以使用 settings 对象获取配置信息from_crawler:在这里通过 crawler 对象创建中间件的实例可以获取全局配置信息spider_opened(可选): 在这里执行爬虫启动时的初始化操作例如打开文件、连接数据库等process_request(可选): 在这里对请求进行预处理例如修改请求头、添加代理等那么同理process_response(可选) 爬虫中间件模板 class MySpiderMiddleware(object):def __init__(self, settings):# 在这里进行中间件的初始化可以使用 settings 对象获取配置信息passclassmethoddef from_crawler(cls, crawler):# 在这里通过 crawler 对象创建中间件的实例可以获取全局配置信息settings crawler.settingsreturn cls(settings)def process_spider_input(self, response, spider):# 在这里处理从下载器传递给爬虫的响应对象return responsedef process_spider_output(self, response, result, spider):# 在这里处理爬虫生成的结果例如对结果进行过滤或修改return resultdef process_spider_exception(self, response, exception, spider):# 在这里处理爬虫产生的异常pass 下载中间件模板 class MyDownloaderMiddleware(object):def __init__(self, settings):# 在这里进行中间件的初始化可以使用 settings 对象获取配置信息passclassmethoddef from_crawler(cls, crawler):# 在这里通过 crawler 对象创建中间件的实例可以获取全局配置信息settings crawler.settingsreturn cls(settings)def process_request(self, request, spider):# 在这里对请求进行预处理例如修改请求头、添加代理等return None # 返回 None 表示继续处理请求或者返回一个新的请求对象def process_response(self, request, response, spider):# 在这里对响应进行处理例如修改响应内容、判断是否重新发送请求等return response # 返回响应对象或者返回一个新的响应对象def process_exception(self, request, exception, spider):# 在这里处理请求异常例如记录日志、发送通知等pass三、位置 我们自定义的中间件在middlewares.py中编写类就可以
http://www.laogonggong.com/news/129544.html

相关文章:

  • 电商网站页面分类青岛网站建设建议
  • 合肥网页模板建站网站开发计入什么会计科目
  • 少儿免费学编程的网站免费推广网站入口2023燕
  • 浙江台州网站制作电子商务网站设计方案
  • 如何制作淘客导购网站天津怎么建立企业网站
  • 网站建设保密协议范本网站建设首页需要哪些元素
  • ppt成品网站成都网络推广网站
  • 做一网站需要哪些语言厦门 外贸商城网站制作
  • 杭州网站做的好公司名称网站整体克隆包含后台
  • 深圳画册设计网站腾龙官方网站做号软件
  • 中文域名 网站wordpress网站域名地址
  • 注册网站后怎么建设福田附近做网站公司
  • 点击图片是网站怎么做的就是做网站的.....
  • 深圳h5模板建站晋中路桥建设集团有限公司网站
  • 公众号怎么导入wordpress网站找人做seo然后网站搜不到了
  • 合肥网站建设sina石家庄做手机网站建设
  • 无锡电子商城网站建设企业微信商城
  • 付费网站建设模板宜章网站建设
  • 网站开发流程框架网页界面清空筛选下载
  • 学做网站论坛vip教程网站的策划与建设阶段
  • 福州微信网站关于茶文化网站建设的背景
  • 帮别做网站h5制作软件 知乎
  • 务川县住房和城乡建设局网站收不到wordpress的邮件
  • 广州市官网网站建设报价网站推广免费 优帮云
  • 网站内链怎么布局电子工程师培训机构哪个好
  • 网站解析 cnamewordpress可以设定多级类
  • 做导购网站wordpress自定义搜索当前页
  • 做网站需要购买网站空间吗南宁企业网站设计
  • 南昌网站网页设计哈尔滨建设部网站
  • 美食网站开发报告还有什么类型的网站