主要基于以下的 Python 的第三 library
- 知乎
- 126邮箱
- weibo.cn (验证码识别困难,建议不要用这种方式) 和 mweibo.cn (推荐使用)
- 百度
- WebQQ by opdss 还有点问题
- Webweixin by opdss
- 微博网页版
- lantouzi by opdss
- jd.com by henry51
- liepin.com by henry51
- 拉勾网 by opdss
- xueqiu.com by xchaoinfo
- v2ex.com by zeekvfu
- guokr.com by Zhao Min
- blog.CSDN.net by guoruibiao 博客
- dlut 大连理工大学校园网相关 by guoruibiao 博客
- attop.com by justZERO
- github.com by wuxiaoxiaoshen
- B站
- 豆瓣
- 重构代码,增加可扩展性
- 增加新浪微博网页版的登录 (已解决)
- 增加 QQ 空间 和 QQ 邮箱的登录
- 重新组织文件结构和代码风格,make it esay to read
- 增加可扩展性,方便添加新的功能, 现在开发新功能的例子还很不优雅。
欢迎大家一起来 pull request
- pull request 尽量做到 Py2 和 Py3 版本的兼容。
- 增加新的网站登录
- 改进错误, Python版本的兼容
- 基于模拟登录增加新的功能。
- 欢迎加入 QQ 群 465363184 交流学习, 或者发邮件到 [email protected] 进行交流
- 视频教程已经上传到腾讯视频和优酷视频,可以通过搜索
Python 模拟登录那些事儿
找到 - 视频教程同时也在微信公众号更新了,点击扫一扫关注我的微信公众号:xchaoinfo
如果本项目对你有用,欢迎对本项目进行捐赠,捐赠时候请留下你的github ID,当然您也可以匿名捐赠。
-
这个项目开始于 2016.2,有些网站改了规则,可能模拟登录不能使用了,授人以鱼不如授人以渔,后面会维护几个典型的模拟登录,并且会给出每个模拟登录的教程,初步考虑是视频,这样对于刚刚接触爬虫,对于抓包分析技术一脸懵逼的初学者来说比较友好,后面可能会更新图文的教程。教程目前制作中,我新注册了一个微信公众号 xchaoinfo, 教程的更新会在微信公众号提醒,欢迎关注
-
项目写了一段时间后,发现代码的风格和程序的易用性,可扩展性,代码的可读性,都存在一定的问题,所以接下来最重要的是重构代码,让大家可以更容易的做出一些自己的小功能。
-
如果你觉得某个网站的登录很有代表性,欢迎在 issue 中提出, 如果网站的登录很有意思,我会在后面的更新中加入
-
网站的登录机制有可能经常的变动,所以当现在的模拟的登录的规则不能使用的时候,请在 issue 中提出 如果时间允许的话,我会更新。