V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
niceday
V2EX  ›  问与答

怎么防止前端页面被采集?

  •  
  •   niceday · 2015-06-11 08:12:07 +08:00 · 4410 次点击
    这是一个创建于 3447 天前的主题,其中的信息可能已经有所发展或是发生改变。

    防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法

    24 条回复    2015-06-11 23:22:57 +08:00
    FrankFang128
        1
    FrankFang128  
       2015-06-11 08:14:40 +08:00 via Android
    把内容写在CSS里,使用你自己特制的字体,比如『我』的Unicode 码对应你
    myleon
        2
    myleon  
       2015-06-11 08:19:08 +08:00
    加干扰码或者异步加载内容,不过不管怎么防止采集对搜索引擎都不友好
    banri
        3
    banri  
       2015-06-11 08:29:22 +08:00 via iPhone
    直接来源不就行了,妈妈再也不用担心被采集啦!

    说真的都写前端了,就不要担心扒皮的事儿,因为100%可以被扒皮啊…
    banri
        4
    banri  
       2015-06-11 08:29:39 +08:00 via iPhone
    :D 打错了是开源
    kisshere
        5
    kisshere  
       2015-06-11 08:46:29 +08:00 via Android
    全部用js生成模板
    binux
        6
    binux  
       2015-06-11 08:51:32 +08:00 via Android
    没有办法
    lwbjing
        7
    lwbjing  
       2015-06-11 08:51:37 +08:00
    canvas重绘。。
    endoffight
        8
    endoffight  
       2015-06-11 08:59:42 +08:00
    js模板 selenium直接秒杀
    typcn
        9
    typcn  
       2015-06-11 09:01:23 +08:00
    修改 nginx 配置,listen 80 改成 listen 127.0.0.1:80
    song940
        10
    song940  
       2015-06-11 09:21:22 +08:00 via iPhone
    @typcn 正解,除此之外,其他的方案都不能完美解决。
    learnshare
        11
    learnshare  
       2015-06-11 09:38:35 +08:00   ❤️ 1
    后端直接渲染成图片
    seerhut
        12
    seerhut  
       2015-06-11 09:43:41 +08:00
    只要字体规整,图片也能高效ocr....
    gangsta
        13
    gangsta  
       2015-06-11 09:46:51 +08:00
    Havee
        14
    Havee  
       2015-06-11 09:50:17 +08:00
    不可能,综上
    onlyice
        15
    onlyice  
       2015-06-11 09:52:25 +08:00 via Android
    Canvas....
    johnsmith123
        16
    johnsmith123  
       2015-06-11 09:55:22 +08:00
    怎么防止我发到网上的东西不会被复制?
    liujiantao
        17
    liujiantao  
       2015-06-11 10:10:11 +08:00 via Android
    看看我这个 /t/157243
    kokdemo
        18
    kokdemo  
       2015-06-11 10:10:33 +08:00
    ……我觉得这只是增加了采集的门槛

    但是也够了
    thankyourtender
        19
    thankyourtender  
       2015-06-11 10:14:06 +08:00
    日他,正面刚他,
    Andy1999
        20
    Andy1999  
       2015-06-11 10:16:43 +08:00 via iPhone
    屏蔽外部IP
    binux
        21
    binux  
       2015-06-11 10:25:49 +08:00
    @gangsta 于是,你不是把这个赛高科技爬到 V2EX 来了吗?
    mcone
        22
    mcone  
       2015-06-11 11:36:21 +08:00
    没办法 很难

    百度知道现在的做法是,如果你ip访问频率过高,会随机替换一段话中的某几个字,用图片显示,这样你采集到的文字就是不完整的奇奇怪怪的
    Hawk
        23
    Hawk  
       2015-06-11 13:29:31 +08:00
    @Havee 这个也是有点屌。。
    amxku
        24
    amxku  
       2015-06-11 23:22:57 +08:00
    其实还是有一些办法的,除了频率外,比如判断访问路径,是否加载了资源文件等等,就看你这数据是不是值得花这么大成本去做
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1941 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 00:30 · PVG 08:30 · LAX 16:30 · JFK 19:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.