V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
bobobo80
V2EX  ›  酷工作

[北京][招聘][人人车] 初/高级爬虫(抓取)工程师

  •  
  •   bobobo80 · 2018-04-09 14:11:16 +08:00 · 3555 次点击
    这是一个创建于 2419 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Hi,v2ex 的朋友们,人人车抓取团队招聘啦,欢迎大牛一起并肩战斗。

    关于我们:

    • 人人车二手车致力于打造全新的个人二手车交易模式,帮助人人车网用户买车、卖车、二手车评估、二手车检测。
    • 人人车二手车服务于全国 100 多个城市,帮助买车用户买到合理、优质的个人二手车,帮助卖车用户快速卖个好价钱,在人人车网,买车、卖车流程透明,无差价,更放心!
    • 地址:北京-朝阳-北苑-铁建广场

    爬虫(抓取)工程师 10-20k

    • 职位职责:
    1. 负责开发和维护数据抓取、清洗任务;
    2. 保证数据抓取准确性、实时性;
    • 职位要求:
    1. 熟悉计算机相关基础知识,了解基本的数据结构和算法,熟悉 python/go/c++/java 等一种编程语言;
    2. 熟悉 TCP/IP、http 协议,熟悉爬虫原理,熟悉常见的反爬虫技术,熟悉 html、dom、xpath 等;
    3. 熟悉 sql 操作,熟悉 linux 基本操作,了解 redis 等 nosql 应用;
    4. 了解 scrapy/pyspider 等框架或手写过爬虫框架者优先

    分布式爬虫(抓取)高级工程师 15-30k

    • 职位职责:
    1. 参与大规模分布式抓取框架建设;
    2. 完善抓取架构,不断提升系统的准确性、实时性;
    • 职位要求:
    1. 熟悉计算机相关基础知识,了解基本的数据结构和算法,熟悉 python/go/c++/java 等一种编程语言;
    2. 熟悉 TCP/IP、http 协议,熟悉爬虫原理,熟悉常见的反爬虫技术,熟悉 html、dom、xpath 等,有至少两年爬虫相关项目经验;
    3. 熟悉分布式系统、消息队列、nosql、数据仓库等;
    4. 对 scrapy/pyspider 等爬虫框架有较深入的理解,或具有大规模的爬虫系统的设计和开发经验;
    5. 有大规模数据处理、数据挖掘、信息提取等经验者优先。

    简历投递: [email protected]

    13 条回复    2018-05-04 13:28:26 +08:00
    chendajun
        1
    chendajun  
       2018-04-09 17:45:33 +08:00
    对学历有限制吗?平常工作就是基于 scrapy 开发各种爬虫脚本。看过 pyspider 源码,根据需求对 pyspider 定制开发过。
    bobobo80
        2
    bobobo80  
    OP
       2018-04-09 21:35:47 +08:00 via iPhone
    @chendajun 学历没有限制
    wl2358
        3
    wl2358  
       2018-04-09 22:49:35 +08:00 via Android
    刚自学出来的,基本的请求,动态的,scrapy 以及 scrapy -redis,这样的 ok 吗
    stop9125
        4
    stop9125  
       2018-04-09 23:39:43 +08:00 via iPhone
    已发送。希望加入
    bobobo80
        5
    bobobo80  
    OP
       2018-04-10 08:19:54 +08:00 via iPhone
    @wl2358 一般来说更关注基础知识是否扎实,爬虫相关的技能其实还是很容易上手的。
    snal123
        6
    snal123  
       2018-04-10 08:21:48 +08:00 via iPhone
    工作时间? 995or996
    bobobo80
        7
    bobobo80  
    OP
       2018-04-10 08:25:03 +08:00 via iPhone
    @snal123 正常是 10-7-5,晚上可能会加会班,周末一般不加班,周末需要加班的话会有调休或补助。
    qwertty01
        8
    qwertty01  
       2018-04-10 09:39:15 +08:00
    有意。一直在做 Java 爬虫。
    zcguo
        9
    zcguo  
       2018-04-10 13:42:33 +08:00
    招应届生吗,有 8 个月的爬虫实习经验,已经在拉勾上投了简历
    Leigg
        10
    Leigg  
       2018-04-10 22:12:05 +08:00 via iPhone
    条件符合,然而在重庆。。
    bobobo80
        11
    bobobo80  
    OP
       2018-04-12 21:17:48 +08:00 via iPhone
    @qwertty01 虽然我们应该还是会维持 python 技术栈,不过有兴趣欢迎来聊一下。
    tuzigg
        12
    tuzigg  
       2018-04-17 11:45:13 +08:00
    支持远程办公么? python 5 年老司机
    bobobo80
        13
    bobobo80  
    OP
       2018-05-04 13:28:26 +08:00
    @tuzigg 暂不支持
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3449 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 10:29 · PVG 18:29 · LAX 02:29 · JFK 05:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.