本文仅交流爬虫技术,讨论其中的思路,不做教程使用!!!
前言(feihua1.0)
通过前一篇文章,相信大家明白了,网站生成验证码的时候,便预留下"答案",以便校验用户输入的验证码是否正确,唯一不同的是网站预留的"答案"破解的难与易,下面我们基于上篇的文章的思路,再进行分析.
分析(feihua2.0)
看到源码的小伙伴,已应该知道,上一篇文章是通过拿到cookies里拿到验证码加密后的16位MD5值,反推4位验证码值(范围:0-9,a-z),写了4层for循环(这还真不是人干的事),这也不是不好,而是太辣眼睛了.
那我们可不可以,不反推也不正推16位MD5值呢?
思路(feihua3.0)
既然加密值在cookies里,那携带我们自己设定好的加密值发送请求?
代码实现(shixianbuliao)
import hashlib
import requests
from parsel import Selector
yzm = '二狗子'
....此处略去....
html = Selector(response.text)
link_list = html.css('div.line').getall()
print(link_list)运行结果(baocun)
结语(shougong)
以上汇报完毕.如果需要源码的小伙伴,后台私信验证码2,下篇文章再见.
| 留言与评论(共有 0 条评论) “” |