V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wsglj
V2EX  ›  外包

数据抓取前、后端项目找外包,兼职专职都可以

  •  
  •   wsglj · 2020-12-01 09:12:50 +08:00 · 1038 次点击
    这是一个创建于 1455 天前的主题,其中的信息可能已经有所发展或是发生改变。
    数据抓取前、后端项目找外包,兼职专职都可以

    工作内容:
    电商平台数据抓取与分析,包括前、后端开发

    要求:

    有数据抓取项目开发经验,2 年以上 Python 相关项目经验
    熟练掌握前、后端开发技术,熟悉了解 VUE 等框架开发,对实践新技术有热情有耐心
    能够快速完成排期的需求,按时高质量交付
    熟练使用 git,有远程办公经验

    招聘类型:外包零活
    专业领域:开发
    工作方式:线上兼职
    17 条回复    2020-12-03 12:23:09 +08:00
    whevether
        1
    whevether  
       2020-12-01 09:18:53 +08:00
    什么电商数据抓取。就是爬虫嘛, 还爬电商的。真的有人不怕吃牢饭吗? 爬虫爬的好。牢饭少不了
    cian
        2
    cian  
       2020-12-01 09:19:32 +08:00
    来 base64 解码:cHV0aTU2NzIxMjM=
    dddd1919
        3
    dddd1919  
       2020-12-01 09:37:03 +08:00
    不了解《非法获取计算机信息系统数据罪》的优先?
    wushigejiajia01
        4
    wushigejiajia01  
       2020-12-01 10:03:19 +08:00
    这种事, 暗地里搞也就算了

    在 V2 这种不能自己删帖的地方发, 想啥呢
    barrysn
        5
    barrysn  
       2020-12-01 10:05:18 +08:00
    怕是去年的事情还是太小了
    S8I86w6eTxeLcK0a
        6
    S8I86w6eTxeLcK0a  
       2020-12-01 10:15:03 +08:00
    违法行为 建议举报
    wsglj
        7
    wsglj  
    OP
       2020-12-01 10:19:16 +08:00
    @whevether 还是要分的吧,一不爬个人数据 ,二不爬全网数据,只抓取部分公开数据,不违法啊
    wsglj
        8
    wsglj  
    OP
       2020-12-01 10:19:59 +08:00
    @dddd1919 不做违法的事情是肯定的。
    wsglj
        9
    wsglj  
    OP
       2020-12-01 10:24:44 +08:00
    @zhengdutech ssfd,正常数据抓取也搞得这么敏感吗?
    wsglj
        10
    wsglj  
    OP
       2020-12-01 10:27:23 +08:00
    @barrysn 涉及抓取个人信息、全站重要数据并复制赢利,导致对方业务运行负载太大,或者直接竞争业务,这些才是违法的吧。
    comsweetcs
        11
    comsweetcs  
       2020-12-01 10:38:44 +08:00
    做爬虫的真的太危险了。。。给我 10w 一个月,我都不干。
    wsglj
        12
    wsglj  
    OP
       2020-12-01 11:16:12 +08:00
    谢谢大家提醒,特意去看了一下,有这个 GIT
    https://github.com/HiddenStrawberry/Crawler_Illegal_Cases_In_China

    守法是必须的,大家请放心
    wsglj
        13
    wsglj  
    OP
       2020-12-01 11:17:45 +08:00
    @comsweetcs 相信官府会更新细化相关规定,正常的技术使用总归是要支持的。之前可能确实乱了一点,新的技术出来没人管,野蛮生长。规范也是好事情,大家都按照规矩来。
    yaoye555
        14
    yaoye555  
       2020-12-01 11:34:20 +08:00
    eWFveWVlNTU1
    wsglj
        15
    wsglj  
    OP
       2020-12-01 11:42:11 +08:00
    这个文章也分析得不错,主要是个人信息、版权信息、还有商业机密这种不要抓取 。https://cloud.tencent.com/developer/article/1462074

    其实最大的困扰是反爬吧,如果用上 IP 池或者自动验码也成了违法 ,这就麻烦了。相信还是要看后果,是不是让对方的服务被影响,和后期有违法使用等吧。
    hackerang
        16
    hackerang  
       2020-12-01 16:25:45 +08:00
    aGFja2VyYW5n
    barrysn
        17
    barrysn  
       2020-12-03 12:23:09 +08:00
    现在法律规定 太模糊了,一不小心就把自己搞进去了,爬虫类的最好还是不碰,
    在不影响对方服务器的前提下,自己偷摸用,应该没事(不确定),涉及商业行为的最好一点也没沾
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3192 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 13:32 · PVG 21:32 · LAX 05:32 · JFK 08:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.