博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Scrapy框架的基本使用
阅读量:5987 次
发布时间:2019-06-20

本文共 288 字,大约阅读时间需要 1 分钟。

安装

pip install scrapy

基础使用

1. 创建一个工程:scrapy startproject

 

2. 在工程目录下创建一个爬虫文件

cd 工程scrapy genspider 爬虫文件的名称 起始url

3.  对应的文件中编写爬虫程序来完成爬虫的相关操作

4. 配置文件的编写(settings)

USER_AGENT:伪装身份用的

ROBOTSTXT_OBEY:默认是True,改成False。True会严格遵从门户网站的robot协议

5. 执行

转载于:https://www.cnblogs.com/lshedward/p/10696932.html

你可能感兴趣的文章
Laravel思维导图之Laravel HTTP路由、中间件、控制器
查看>>
巧用 db.system.js 提升20% 开发效率
查看>>
JavaScript 对象所有API解析
查看>>
javascript实现简单的trello实例
查看>>
http那些事:http\http2\https
查看>>
浏览器发送http请求过程分析
查看>>
Node学习记录: koa
查看>>
新人上路-搭建项目-maven和gradle
查看>>
Struts2初始化过程
查看>>
函数式编程(二)
查看>>
330. Patching Array
查看>>
《Android智能穿戴设备开发指南》——第6章,第6.1节Socket编程基础
查看>>
2017-12-26和27学习笔记
查看>>
实现promise
查看>>
html邮件踩坑小结
查看>>
从源码看Android常用的数据结构 ( 七, SDK28下的HashMap )
查看>>
Java并发编程—volatile
查看>>
iOS根据宽高寻找最合适的字体大小(一)
查看>>
小程序封装wx.request请求并创建接口管理文件
查看>>
Vue+webpack搭建自己的脚手架
查看>>