有感于爬虫技术的威力 (/t/164359) 我深深地觉得,这是个强有力的工具!所以特别想拥有这样的Super Power。哪怕学习需要的时间久一点,要看很多书也没关系。
我非计算机专业,有的只是十足的兴趣,和一些系统使用方面的知识,对 Linux ,仅仅懂得一些最最基本的命令行操作,但是也没怎么用过。所以,可能需要各位前辈从基础方向开始指导一个方向。需要补的框架知识是什么,最好有一个针对性的书目推荐啥的~
如能得到前辈们的一些指导,定能少绕很多弯路,在此先行谢过!
1
Eymard 2015-02-01 23:52:36 +08:00
head first系列 随便看看先有个概念
|
3
binux 2015-02-01 23:58:00 +08:00 1
|
4
muziyue 2015-02-02 06:00:53 +08:00
html+http协议+python 这个应该最简单了
|
5
justjavac 2015-02-02 08:30:40 +08:00
|
6
mhycy 2015-02-02 08:57:51 +08:00
把python的第三方包 requests 学会就算入门了
|
7
phoeagon 2015-02-02 09:17:36 +08:00
从认识到不要自己写爬虫开始。
|
8
em70 2015-02-02 14:01:13 +08:00 via Android
先写个最简单的,然后不断完善,抓豆瓣吧
|
9
wizardforcel 2015-02-02 14:02:56 +08:00
你先看curl和regex就好。
|