1
gyh 2017-12-14 12:41:41 +08:00
一所大学的要么
|
2
zzw888888 2017-12-14 13:05:14 +08:00
这边是资深抓取:wx:bestdata
|
7
lsxiao 2017-12-14 14:29:25 +08:00
@sweetcali Base64,这是解码网站,解冒号后面的就行了。https://1024tools.com/base64
|
11
cxl008 2017-12-14 14:40:45 +08:00
码工作量了。。。。
|
12
kuroismith 2017-12-14 14:42:02 +08:00
麻将脸
|
13
mrsunday 2017-12-14 16:35:23 +08:00
叫我 wx:mrsundaychen,可以详聊
|
14
linuxchild 2017-12-14 17:34:50 +08:00
1 个学校有 500 个公开信息的话大概是 50。。GG
|
15
leyle 2017-12-14 17:50:33 +08:00
@linuxchild 你这样一算,好廉价。
一个城市,以成都为例,4 个一本,估计有几个二本,两个加起来估计有十来个,或者更多一点。 把这八个城市综合一下,算 15 个学校一个城市,总的就是 120 个学校。 每个学校假设有 500 个公开信息,就是差不多 6000 块,这个 500 个公开信息还是乐观估计的。 如何寻找到这些公开信息,并且写规则提取出来,都是工作量,同一个学校的不同页面,如果存在了这些信息, 很有可能规则是不一样的,换句话说,一个学校估计有好几个提取规则。 120 个学校,保守估计,至少要写 300 个规则。然后乐观估计才 6000 块。 20 块钱一个规则。 为什么这里这个就没人吐槽价格低廉,还一堆人留联系方式了。 |
17
sweetcali OP 不是我个人的想法。。。上面有老总,我也非常头疼,现在是纯人工在录入,纯人工!
|
18
lhx2008 2017-12-14 18:54:11 +08:00 via Android
之前做过是 5 毛一条,联系方式大部分都没有,每个学院的样式不一样,gg
|
20
codeyung 2017-12-14 19:30:50 +08:00
。。。这价格
|
21
jatesun 2017-12-14 20:33:52 +08:00
按学校来还差不多,一个学校 1000。→_→
|
22
xingzheduan 2017-12-14 21:27:11 +08:00 via Android
我感觉一毛一条太便宜了因为每个学校的网页是不同的,意味着可能要根据不同的网页写相对应的爬取规则
|
23
402124773 2017-12-14 21:33:46 +08:00
最近在家闲着,wx:13267223917
|
24
juedi998 2017-12-14 21:44:37 +08:00
表示有心无力啊,一毛一条真的廉价了些,网页太多啦,
|
26
wh01096045 2017-12-14 21:54:26 +08:00
@sweetcali 微信:15578146934
|
27
cszchen 2017-12-14 22:10:44 +08:00 via iPhone
这跟人工录入没太大区别吧
|
29
zzl 2017-12-15 10:50:09 +08:00
微信:zhili124
|
30
linuxchild 2017-12-15 10:56:53 +08:00
|
31
wjx1993 2017-12-15 12:38:31 +08:00 via Android
@linuxchild 也对,体力活,小心身体吃不消😂
|
32
JayFang1993 2017-12-15 13:50:19 +08:00
体力活 每个学校官网也不统一~~~~
|
33
jssyxzy 2017-12-18 10:25:05 +08:00
我可以看看,还收人不,另外怎么防止不同的人抓取重复呢
|
35
itsql 2018-01-18 21:57:17 +08:00
我有相关的数据,可以合作,请联系我
|
36
NotNil1 2018-01-22 16:27:21 +08:00
直接用手把,写爬虫也快不了多少的
|