xenos
2020-04-27T09:47:16+00:00
[url]https://blog.csdn.net/shenchi5320/article/details/88068040[/url]
爬虫实际上很简单的…但是能干的事不少
但是我自学是为了应付体制里的各种傻逼系统…
我的第一个爬虫是爬本子的,当时爬了2w本不重复的[s:ac:哭笑]。
[quote][pid=417703366,21528422,1]Reply[/pid] Post by [uid=17503644]加贺野 爱[/uid] (2020-04-29 17:52):
爬虫实际上很简单的…但是能干的事不少
但是我自学是为了应付体制里的各种傻逼系统…[/quote]大佬出个教程吧。。。
傻逼系统越来越多了
以前爬汽车之家的时候,设置了几个关键字 黑丝, 媳妇,炮。。爬了9个G的图片
最初练手就是爬各种福利网站的妹子图啊,还真是各种类型,有直接规则顺序命名的,有要正则解析出地址的,有要信息的……
我不会告诉你前些天我无聊,写了个爬虫,随随便便爬了几个G的妹子图噢。
还都是整理好的噢
[s:a2:诶嘿]
怎么样,有动力了吗
时光徽章出来前用0基础学爬虫爬5173,做金币走势图,到现在还不会把数据导入到excel,都是手动复制粘贴[s:ac:哭1]
之前写了个爬虫,会自动去某网站爬当天新出的片,还会自动导入115[s:ac:茶]
Reply to [pid=417730479,21528422,1]Reply[/pid] Post by [uid=36205537]jk4235[/uid] (2020-04-29 19:20)
老哥出个教程吧,这个好实用
还是得根据页面筛选器来的,得先研究一下神秘网站的页面,不过我都有神秘网站的页面了,为啥要下下来,直接冲不好吗
核心还是识别算法,爬虫只是个工具
识别算法写的好,精彩图片看到饱
识别算法写的差,打开全是葫芦娃
好的,现在就学![s:ac:上][s:ac:上][s:ac:上]