V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
sohoer
V2EX  ›  问与答

国内这么多采集器,造就了大量的垃圾站,国外有没有人用采集器,有没有这种现象?

  •  
  •   sohoer · 2012-11-23 16:38:12 +08:00 · 8694 次点击
    这是一个创建于 4365 天前的主题,其中的信息可能已经有所发展或是发生改变。
    20 条回复    1970-01-01 08:00:00 +08:00
    l0wkey
        1
    l0wkey  
       2012-11-23 16:42:10 +08:00
    有。
    sohoer
        2
    sohoer  
    OP
       2012-11-23 16:44:12 +08:00
    @l0wkey 那你知道有什么采集器吗?我就是不会搜,找不到
    soudesuka
        3
    soudesuka  
       2012-11-23 16:47:28 +08:00
    外国的普世价值不允许有采集器,没有法律条例约束,这是信仰的力量。
    sohoer
        4
    sohoer  
    OP
       2012-11-23 16:51:44 +08:00
    @soudesuka 采集器要看在什么人手中对吧,这工具是肯定需要的,
    GOOGLE其实也是靠的采集
    kava
        5
    kava  
       2012-11-23 16:54:12 +08:00
    国外也有采集的垃圾站。。。。只不过是要少些
    flyingkid
        6
    flyingkid  
       2012-11-23 16:57:47 +08:00
    看是采集的用途咯。采集还是有很多人写的。
    如果只是写出来copy一个站的,还是比较少的。
    sohoer
        7
    sohoer  
    OP
       2012-11-23 17:05:29 +08:00
    @flyingkid 我想也是,只是就是找不到国外的采集工具,呵呵
    likai
        8
    likai  
       2012-11-23 18:00:25 +08:00
    为什么一定要用国外的采集工具?
    国外应该 叫爬虫之类的吧...
    scg16
        9
    scg16  
       2012-11-23 18:11:04 +08:00
    记的美国有个专门做垃圾站的公司上市了,前年下半年的事。
    Keinez
        10
    Keinez  
       2012-11-23 18:12:21 +08:00
    @soudesuka 在国外随意转载是要受到追究的,详见各种各样的协议诸如CC/GNU/GPL……这和普世价值和信仰什么无关。君不见香港的外国人一到内地就开始随地乱扔垃圾?
    ilovehoo
        11
    ilovehoo  
       2012-11-23 18:14:38 +08:00
    @scg16 Demand Media, Inc.~ (NYSE:DMD)
    Mr01
        12
    Mr01  
       2012-11-23 18:38:55 +08:00
    手法不同 国外有专门的机器人软件卖
    lentrody
        13
    lentrody  
       2012-11-23 18:53:44 +08:00
    gelbooru.com 纯拷贝danbooru
    不过貌似现在是和 danbooru.donmai.us 共享图库……
    armoni
        14
    armoni  
       2012-11-23 21:14:25 +08:00
    国外采集站也不少,只是google反垃圾比百度迅猛,导致垃圾站流量减少,数量日渐消退
    Ultratude
        15
    Ultratude  
       2012-11-24 07:38:08 +08:00
    @sohoer 做垃圾站的印度哥不要太多。
    Semidio
        16
    Semidio  
       2012-11-24 07:57:32 +08:00
    这个我怎么记得国外有好多专门的软件弄的,还是收费的,可以订阅多个RSS,读取其内容后,使用同义词替换的方法来避免Google的惩罚。比如这家: http://wprobot.net/ 还有这家 http://wpturbo.com/ ,搜索Autobloging或者auto posting能出来好多。
    maddot
        17
    maddot  
       2012-11-24 11:11:50 +08:00
    以前做英文博客,被一个中国佬每篇自动采集到goole家的blogspot上,还总排名在我之前。
    Mutoo
        18
    Mutoo  
       2012-11-24 11:25:12 +08:00
    前阵子不是还有新闻说国外一个19岁的小伙子做了一个自动摘要的IT信息网站,人家同样是采集,但是信息处理得非常棒呐。
    nonozone
        19
    nonozone  
       2012-11-24 12:01:41 +08:00   ❤️ 1
    都说中文文章一大抄,在我的使用经验来看,平时搜索各种教程,英文copy程度一点都不必中文弱,搜来搜去都是一样的,也是一大堆牛头不对马嘴东西。当然搜索英文的好处是,很多排名比较靠前的网站相对比较严谨一些。而中文排名靠前的往往是各种博客(还不是独立博客,而是各种门户站博客),以及各种技术门户(这些技术门户本身就挺良莠不齐的),并且牛逼的SEO的软件(垃圾评论,采集,自动博客,包括各种验证码破解)不都是国外的。
    keven
        20
    keven  
       2014-03-23 19:57:17 +08:00
    采集器是工具,如果用来作垃圾内容转载,抄袭,伪原创,仿站这些用途就造成了各种垃圾,这种一方面是用的人的问题,另一方面也是大量采集器提供者以此为赢利点,或者以此为主要功能设计目标,做出来的工具就只能干这个。
    其实采集器也有做得好的,比如八爪鱼采集器,就不带任何伪原创,一键转帖,自动发布站群等等这些垃圾内容制造的功能,相反,一直提倡的是用采集器来做大数据收集,原始素材整理,以便节省重复性的人力劳动,采集有价值的内容,并且对采集到的数据做深加工,以此来提炼价值。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5822 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 01:52 · PVG 09:52 · LAX 17:52 · JFK 20:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.