爬虫- 不用图像识别手段,实现一个简单的验证码登录案例(二)

本文仅交流爬虫技术,讨论其中的思路,不做教程使用!!!

前言(feihua1.0)

通过前一篇文章,相信大家明白了,网站生成验证码的时候,便预留下"答案",以便校验用户输入的验证码是否正确,唯一不同的是网站预留的"答案"破解的难与易,下面我们基于上篇的文章的思路,再进行分析.

分析(feihua2.0)

看到源码的小伙伴,已应该知道,上一篇文章是通过拿到cookies里拿到验证码加密后的16位MD5值,反推4位验证码值(范围:0-9,a-z),写了4层for循环(这还真不是人干的事),这也不是不好,而是太辣眼睛了.

那我们可不可以,不反推也不正推16位MD5值呢?

思路(feihua3.0)

既然加密值在cookies里,那携带我们自己设定好的加密值发送请求?

代码实现(shixianbuliao)

import hashlib
import requests
from parsel import Selector
yzm = '二狗子'
....此处略去....
html = Selector(response.text)
link_list = html.css('div.line').getall()
print(link_list)

运行结果(baocun)

结语(shougong)

以上汇报完毕.如果需要源码的小伙伴,后台私信验证码2,下篇文章再见.

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章