通知公告

当前位置: 首  页 > 中心动态 > 通知公告 > 正文

有关爬虫技术使用的友情提示

发布时间:2022-03-07
点击数:

尊敬的校园网用户:

近期有高校反映,教育网内个别用户非法使用爬虫技术收集高校网站数据,访问频率过高,对网站正常服务构成不良影响。

《网络安全法》与《数据安全管理办法(征求意见稿)》均对数据爬取行为的合法性进行了规定约束。爬虫控制者使用爬虫技术高频率访问网页、平台,并客观导致网页或平台无法正常运行,使其他正常用户无法访问网页的,或变更了被访问网页运行逻辑和模式的。根据相关法律规定,上述行为可能会被认定为是不正当竞争行为,从而承担相应民事赔偿或行政处罚责任的法律风险;后果严重的,甚至会构成破坏计算机信息系统罪,需要承担刑事责任。

在此我们提醒校园网用户,在使用互联网获取数据过程中,应遵守以下几项内容:

1、做好个人电脑安全管理,定期查杀电脑病毒,防止因电脑感染病毒后非法爬取校内外网站数据。

2、因学习科研需要使用爬虫技术时,遵守“Robots”协议,在网页提供者允许的范围内进行数据爬取。避免未经授权爬取公民个人信息等敏感性数据。(Robots协议即robots.txt,存放于网站根目录下,通常用于告知网络爬虫,此网站中的哪些内容是不应被获取的,哪些是可以被获取的。)

3、正当地使用爬虫技术手段爬取数据。不得强行破解网站经营者设置的数据保护措施,避免访问频率过高(不得超过网站日均流量三分之一),避免对网页造成破坏等。对于明显反爬,或者正常情况不能到达的页面不能强行突破,否则是非法行为。

4、遵守国家相关法律法规,禁止爬取用户个人数据非法牟利,包括模拟登录他人账号。禁止爬取大量带有知识产权的数据获取盈利行为。

中心一旦发现上述行为,将立即封停上网账号(包括有线网和无线网账号),并将相关信息及行为提交给上级主管部门。

智慧校园建设中心

2022年3月7日

服务中心:  学院南路校区 - 62289140、62289141  沙河校区 - 61776543、61776544、61776545、61776546

版权所有: 中央财经大学  学院南路校区地址:北京市海淀区学院南路39号

中央财经大学智慧校园建设中心