Scrapy框架的基本使用-白红宇

Scrapy框架的基本使用

阅读量：5987 次

发布时间：2019-06-20

本文共 288 字，大约阅读时间需要 1 分钟。

安装

pip install scrapy

基础使用

1. 创建一个工程：scrapy startproject

2. 在工程目录下创建一个爬虫文件

cd 工程scrapy genspider 爬虫文件的名称 起始url

3. 对应的文件中编写爬虫程序来完成爬虫的相关操作

4. 配置文件的编写（settings）

USER_AGENT：伪装身份用的

ROBOTSTXT_OBEY：默认是True，改成False。True会严格遵从门户网站的robot协议

5. 执行

转载于:https://www.cnblogs.com/lshedward/p/10696932.html

你可能感兴趣的文章

Laravel思维导图之Laravel HTTP路由、中间件、控制器

查看>>

巧用 db.system.js 提升20% 开发效率

查看>>

JavaScript 对象所有API解析

查看>>

javascript实现简单的trello实例

查看>>

http那些事：http\http2\https

新人上路-搭建项目-maven和gradle

《Android智能穿戴设备开发指南》——第6章，第6.1节Socket编程基础

从源码看Android常用的数据结构 ( 七, SDK28下的HashMap )

小程序封装wx.request请求并创建接口管理文件

查看>>

Vue+webpack搭建自己的脚手架

查看>>