爬虫- 不用图像识别手段，实现一个简单的验证码登录案例(二)--粉丝服务平台-粉丝头条-fensifuwu.com

爬虫- 不用图像识别手段，实现一个简单的验证码登录案例(二)

科技 09-14 来源：李文博Data

本文仅交流爬虫技术，讨论其中的思路,不做教程使用!!!

前言(feihua1.0)

通过前一篇文章,相信大家明白了,网站生成验证码的时候,便预留下"答案",以便校验用户输入的验证码是否正确,唯一不同的是网站预留的"答案"破解的难与易,下面我们基于上篇的文章的思路,再进行分析.

分析(feihua2.0)

看到源码的小伙伴,已应该知道,上一篇文章是通过拿到cookies里拿到验证码加密后的16位MD5值,反推4位验证码值(范围:0-9,a-z),写了4层for循环(这还真不是人干的事),这也不是不好,而是太辣眼睛了.

那我们可不可以,不反推也不正推16位MD5值呢?

思路(feihua3.0)

既然加密值在cookies里,那携带我们自己设定好的加密值发送请求?

代码实现(shixianbuliao)

import hashlib
import requests
from parsel import Selector
yzm = '二狗子'
....此处略去....
html = Selector(response.text)
link_list = html.css('div.line').getall()
print(link_list)

运行结果(baocun)

结语(shougong)

以上汇报完毕.如果需要源码的小伙伴,后台私信验证码2,下篇文章再见.

爬虫

发表评论

留言与评论（共有 0 条评论） “”

爬虫在抓取数据的过程中会遇到哪些

网络爬虫爬取数据时常见的六种问题

python爬虫：四种数据解析库提取数据

nodejs爬虫superagent爬取gb2312编

利用Python爬虫技术采集预算公开信

「k哥爬虫普法」程序员183并发爬取

网友投稿普通会员

我还没有学会写个人说明

2116363 篇文章

78806758 次浏览

最近文章

爬虫- 不用图像识别手段，实现一个简单的验证码登录案例(二)

相关文章

推荐文章

最热点击文章

热门标签