1.Urllib:python自带的一个Http请求库,主要是用来操作URL,以便于和网站进行请求响应交互。
2.Lxml:用来进行数据解析的库,主要支持对xml和html两种格式的返回数据进行解析,解析准确度和速度都非常高。
3.Pymysql:数据存储库,用来对关系型数据库MySQL客户端进行操作。
4.Scrapy:爬虫框架,爬虫的主要功能由它实现。对于简单的页面来说可以很轻松的抓取到所有的数据。
请用手机扫描二维码下载
使用手机扫码报名,立即锁定名额
扫一扫,立即报名