该代码集包含网页的普通爬取、字体反爬处理、二进制文件下载、常见的 Ajax 数据爬取、Selenium 模拟登陆、常见四字符验证码识别、极验滑动验证码的破解、点触式验证码的破解、App 爬取、Scrapy 项目等。对像我这种小菜鸟的帮助很大哦。
个人感觉,像我这样的菜鸟和菜鸟小哥哥可以 star,我们可以互相学习,完善代码库。
从 3 月 11 起开始更新。不仅提交新的代码(弹幕爬取、视频下载等),还会抽时间对旧代码进行更新,尽量保证代码的运行的过程不会出现 Bug。
https://github.com/Northxw/Python3_WebSpider
喜欢 Python, 喜欢爬虫,喜欢数据分析的童鞋可以来一起学习哦!
1
andrewTeller 2019-03-16 15:59:44 +08:00 via iPhone
已 star,入门小白好好学习一下
|
2
Northxw OP @andrewTeller 哈哈,握手!这两天正在复习这块知识,顺便更新添加代码,不会的可以提交 issue
|
3
foxyier 2019-03-20 16:37:35 +08:00
emmmmm 看到验证码识别就去看了看,还是很不错的
|