Rinotyl
2022-07-11T16:25:45+00:00
01bz看到一本严肃文学作品,想搞下来深入研究一番,搜遍全网都找不到下载。突发奇想自己搞个爬虫,结果写完代码才发现小说大量关键字被网站替换成25*20px的图片[s:ac:喷][img]https://img.nga.178.com/attachments/mon_202207/18/ekQ2q-3a3hK2lT3cSsg-lc.jpg[/img]
小说一章被分成几页,只有第一页是正常文本格式,后面全是这种图片+文本的玩意太恶心了,以后再也不看01bz了[s:ac:喷][img]https://img.nga.178.com/attachments/mon_202207/18/ekQ2q-1hcjXbZ2zT3cScm-4w.gif[/img]
第一版主和笔趣阁一样。是盗版的代名词
你这个网站找不到。换个就行了
[s:ac:凌乱] 这么复杂 截屏+ocr软件试试?
少女?缝,然后轻轻?送,??仿佛陷入凝脂,鉴定为母上攻略
你可以搜搜看,它有不少书在别的网站也有[s:ac:哭笑] 或者加一道ocr
[quote][pid=625802518,32720396,1]Reply[/pid] Post by [uid=41133039]自崖、而反[/uid] (2022-07-18 00:34):
少女?缝,然后轻轻?送,??仿佛陷入凝脂,鉴定为母上攻略[/quote][img]https://img.nga.178.com/attachments/mon_202207/18/ekQ2q-4t0oKwT3cSiv-hi.jpg[/img]
不过我找的不是这本,只是用它举个例子
尝试一个解决办法
ctrl+f5强制刷新,或者换个浏览器打开这一页,看看某一个字对应的图片名称是不是固定的
如果是固定的说明只是字符编码进行了转换,然后图片名逆向成汉字就很简单
[quote][pid=625803295,32720396,1]Reply[/pid] Post by [uid=43364643]Ka狩猎[/uid] (2022-07-18 00:39):
尝试一个解决办法
ctrl+f5强制刷新,或者换个浏览器打开这一页,看看某一个字对应的图片名称是不是固定的
如果是固定的说明只是字符编码进行了转换,然后图片名逆向成汉字就很简单[/quote]确实是固定的,反向换回去也确实可以,就是工作量有点大,我感觉至少有一百多个字形是图片格式[s:ac:喷]
搜书吧没有?这可是相当全的网站了,很多老书都有人整出精编版的