Lmao
2021-04-05T06:58:32+00:00
事情大概是这样的,前天收到领导需求,问我会不会爬虫,他要爬用户数据,还有其他平台的数据,要我去学习一下。然后我回家在学习的时候,我就学啊学,然后看到一个视频,大概就是说有的爬虫行为是违法的,然后我又百度了下相关知识,我发现爬用户数据是违法的啊,还有爬网站的时候,还一个robots协议。
然后我现在的感觉就是我是个菜逼,万一代码没写好,没遵守协议咋办呢?有懂的吗
大学老师好像让爬过,好像网站可以不让爬数据,大学爬过马蜂窝……
明面上使用手段爬取个人用户信息都算是违法行为,公共信息不算
爬虫写得好,牢饭吃到饱。
你描述的这活绝对违法,而且绝对不要觉得出了事只抓你领导,你一定也跑不了
Reply to [pid=506842342,26272529,1]Reply[/pid] Post by [uid=38610271]沉砚[/uid] (2021-04-10 15:08)我才进这公司10多天,你这么一说我都想跑路了
Reply to [pid=506842278,26272529,1]Reply[/pid] Post by [uid=61266495]吾前灯[/uid] (2021-04-10 15:07)
没有人去维权好像是因为诉讼的话需要受害者主动提交被侵害的证据,应为不属于公诉安检检方不会主动调查的,而个人搜集证据就算胜诉赔偿金额对施加方也不痛不痒
Reply to [pid=506842034,26272529,1]Reply[/pid] Post by [uid=62254550]老几几丶[/uid] (2021-04-10 15:06)我刚看了马蜂窝的robots.txt
User-agent: *
Disallow: /
Disallow: /poi/detail.php
这好像是不让爬? 我麻了
看一下根目录下的robots.txt不得了……
这个东西你不违反就行,就算违反了你没造成什么大影响人家也懒得起诉你……
公共信息不违法啊,最笨的用按键精灵都可以做到
用户信息就敏感了,得看是哪种