V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
vvsuperman
V2EX  ›  奇思妙想

大数据人肉搜索

  •  
  •   vvsuperman · 2015-06-19 09:39:32 +08:00 · 13760 次点击
    这是一个创建于 3445 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如通过邮箱,q号,手机等搜索个人信息。应该有很大市场吧,而且技术应该也不难实现
    15 条回复    2015-06-21 12:31:43 +08:00
    welsmann
        1
    welsmann  
       2015-06-19 10:18:59 +08:00
    合法吗?
    letitbesqzr
        2
    letitbesqzr  
       2015-06-19 10:23:35 +08:00
    你说的这个已经有非常多人在做了,只不过公开后必备查
    est
        3
    est  
       2015-06-19 10:32:19 +08:00
    的确技术应该也不难实现,就差一个码农了。
    deben
        4
    deben  
       2015-06-19 10:35:08 +08:00
    社工库?
    RIcter
        5
    RIcter  
       2015-06-19 10:35:15 +08:00
    这不就是社工库吗?都有一套开源的程序做这个了。

    http://www.weigongkai.com/
    http://www.wamima.com/
    v2015
        6
    v2015  
       2015-06-19 10:53:20 +08:00
    几个泄漏数据库匹配统计完事的,大数据没这么low,比方对微博微信QQ就行舆论势头监控及时排出水军网监,所有装了卫士手机电脑对网页自动截屏监视反馈(比工信部那几个IP好使多了),全城天眼高精度识别追踪人脸定位,银行资金流向关系分析这个就没人敢作了哈哈
    vvsuperman
        7
    vvsuperman  
    OP
       2015-06-19 11:20:46 +08:00
    不是社工库,非个人的敏感信息。而是通过网络爬虫的方式,爬取比如微博,论坛的个人信息,再分析这些信息,得出这个人的数据。爬虫的方式我觉得是可以实现的,语义分析我觉得可能较难。但如果是做特定行业那么应该是可行的,比如分析码农的技术水平等。
    jiangzhuo
        8
    jiangzhuo  
       2015-06-19 11:44:48 +08:00
    @vvsuperman HR表示這個功能不錯 很喜歡啊 哈哈哈
    現在HR都會用Github了
    squallsdjl
        9
    squallsdjl  
       2015-06-19 22:37:38 +08:00
    做高端私人人肉俱乐部,全国一线城市做线下的,我相信会有人来的。
    jsq2627
        10
    jsq2627  
       2015-06-19 22:43:58 +08:00
    上学期的大作业做的就是类似这样的东西。
    在做的已经有很多了。
    抓取数据没什么技术难度,但是时间成本高呀。人家真正做这个的都是用各种裤子做的。
    我上学期抓了1TB的QQ空间个人资料+留言表,然并卵。真正能做出实用的产品,需要的数据量太大了。。。
    ligyxy
        11
    ligyxy  
       2015-06-20 02:03:51 +08:00
    不巧我司是做这个的,只不过数据来源远不止自己去抓,数据的用途也不是人肉,虽然本质上没差

    确实市面上有很多人在做了,不过只用于人肉搜索或者直接出售个人信息的话一来没有很好利用数据,二来恐怕不合法
    vvsuperman
        12
    vvsuperman  
    OP
       2015-06-20 10:00:18 +08:00
    @ligyxy 问下贵司是什么公司?我觉得这块挺好玩的,就不知道目前市面上有哪些产品?比如我想知道码农的信息,那么我只要针对github,csdn等进行数据抓去;或是分析潜在特定消费信息的话,比如抓取草榴用户的相关信息
    vvsuperman
        13
    vvsuperman  
    OP
       2015-06-21 09:58:20 +08:00
    @squallsdjl 高端私人俱乐部,这是啥
    idcspy
        14
    idcspy  
       2015-06-21 11:30:39 +08:00
    能做出来就去做吧,去年有个被yahoo高价收购了,国内的团队.
    mrjoel
        15
    mrjoel  
       2015-06-21 12:31:43 +08:00
    人肉的本质 从来都是大数据吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1311 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 17:54 · PVG 01:54 · LAX 09:54 · JFK 12:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.