一个爬虫脚本能够实现的功能简单的来说就是抓取数据,然后保存数据,所以写一个爬虫脚本就是实现这两个功能的过程。
取数据:使用request库的get函数去请求想要的抓取数据的网站,数据返回后用response.encode方法指定编码格式,然后就可以用Re库去匹配想要的数据了。
存数据:用with open语句创建一个文件设定,读写模式和编码格式后就可以write()方法将数据存储到其中了。
请用手机扫描二维码下载
使用手机扫码报名,立即锁定名额
扫一扫,立即报名