优草派  >   Python

爬虫数据采集违法吗?什么样的行为使用爬虫是违法的

罗西汉            来源:优草派

爬虫技术本身是不违法的,它只是一个工具,会造成违法后果的是使用工具的人的不当行为。那么想要合理正确的使用爬虫数据,就要知道哪些行为是不能做的。下面小编会在下面的文章详细介绍什么样的行为使用爬虫是违法的。

爬虫数据采集违法吗?什么样的行为使用爬虫是违法的

1.爬取商业数据

如果只是爬取行业内公开在万维网上的数据那自然是不违法的,但是很多公司会为了在行业竞争中取得优势,非法的去爬取竞争对手的信息。像是爬取内部高层员工内容、公司内部通告、网站或软件后台数据等都是违法行为,18年的武汉元光公司爬取他人软件后台数据一案就是典型例子。

2.站点有明确声明

在你采集数据之前需要了解站点的法律声明,如果当你采集的站点有声明禁止爬虫采集或者禁止转载时你还去爬取那就是属于违法行为了。像是淘宝、京东、天猫等电商平台基本上都有禁止采集的说明

3.采集个人信息获利

市场上大多数软件都需要授权协议才能使用,软件公司也会对用户的数据进行存储和分析,这样子是无可厚非的。但是如果使用爬虫采集了用户数据进行售卖、转移等进行获利那就是违法行为,除了赔偿之外还可能有牢狱之灾。

4.违反Robots协议

大部分网站会在Robots.txt文件中告诉爬虫程序哪些内容可以查看,哪些内容不可查看,只要采集了声明过不可查看内容的数据那就是违法的。

总的来说,使用爬虫为自己采集数据学习,参考可以。但是一旦你采集了明确声明过不能抓取的内容和使用数据牟利那就都是违法行为。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。
TOP 10
  • 周排行
  • 月排行