V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
favourstreet
V2EX  ›  程序员

因为爬虫教程,一个网站似乎被 DDOS 了

  •  
  •   favourstreet · 2020-06-11 20:48:21 +08:00 · 4368 次点击
    这是一个创建于 1654 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不是我的网站。详情可见: https://mp.weixin.qq.com/s/ibmitCYw7Txu5xQYsECI-w

    爬虫教程以一个特定网站为目标,偏偏这目标是个人制作的,没那么多资源的小网站。实践教程的人一多,效果就成了 DDOS 。

    网站当然是挂了,但是能说人家是恶意攻击吗?我感觉完全无法从法律上维权,好像只能在技术上设置一些限制,让爬虫教程望而却步。可是这样一来,个人维护的小网站越来越难做了,如果不解决这类问题,互联网上的信息会进一步向资源雄厚的经营者集中。

    能有什么办法?买 DDOS 的商业保险?

    18 条回复    2020-06-13 10:11:22 +08:00
    misty8873
        1
    misty8873  
       2020-06-11 21:04:25 +08:00
    嗯 先买个便宜点的试试
    tanghongkai
        2
    tanghongkai  
       2020-06-11 21:11:50 +08:00
    cf 一套大部分没事找事的都走了,拿别人的网站写爬虫教程真是有够**的
    rayhy
        3
    rayhy  
       2020-06-11 21:13:08 +08:00 via Android
    煎蛋就经常被爬,很多爬虫贴拿它做例子。其实这种情况下只能在技术上加限制,一般加到需要用无头浏览器爬就好很多了,毕竟都是入门教程,上来就要配置无头浏览器很劝退。
    also24
        4
    also24  
       2020-06-11 21:21:48 +08:00
    大概翻了一下,爬虫教程的地址是:
    https://www.zhihu.com/people/1425827033

    目前已删除,在快照里还可以看到记录。

    根据这个爬虫教程的代码,加上大部分爬虫小白其实不会改代码的事实。
    我觉得站长应该可以通过设定简单的 nginx 策略来解决问题。
    另:在微博上看到站长的抱怨,感觉应该只是数据库负载太高,Web Server 应该还活着。


    部分代码:
    https://i.loli.net/2020/06/11/uyMcamsXoSUYCjD.png
    also24
        5
    also24  
       2020-06-11 21:25:44 +08:00
    also24
        6
    also24  
       2020-06-11 21:28:34 +08:00
    根据相应的代码,提一个简单的思路。

    在 WordPress 后台修改伪静态规则,将页面地址修改为:
    http://www.cbaigui.com/?biepale=1

    同时在 nginx 内匹配带有 ?page= 的请求,全部 deny


    这样可以在短时间内解决掉大部分只会复制粘贴代码的小白。
    crella
        7
    crella  
       2020-06-11 22:48:22 +08:00 via Android
    借楼,一个 211 大学的招生网站挂了一张 11MB 大小的图片,导致网页打开缓慢。恶意多次下载这张图片会导致服务器反应缓慢吗?那个服务器的描述是 Oracle iPlanet Server 7.0 。
    yujiang
        8
    yujiang  
       2020-06-11 22:56:10 +08:00
    @crella 你得看那个图是挂在图床上还是嵌在网站里,网站有没有 cdn 。。。另外怀疑你的动机
    tigerstudent
        9
    tigerstudent  
       2020-06-11 23:29:36 +08:00 via Android
    即使拿来做教程,影响也不会很大吧,站方禁掉 ip 或其他特征就好了。
    baiduyixia
        10
    baiduyixia  
       2020-06-12 00:11:56 +08:00
    heiheidewo
        11
    heiheidewo  
       2020-06-12 00:27:15 +08:00
    @tanghongkai 别人是备案网站,在国内,套 CF 不是减速么
    abcbuzhiming
        12
    abcbuzhiming  
       2020-06-12 09:13:48 +08:00
    @crella 会,多个下载连接把你的 IO 打满,和 ddos 的原理差不多的
    ccraohng
        13
    ccraohng  
       2020-06-12 09:16:14 +08:00 via Android
    @tigerstudent 不是几个人。。韭菜多顶不住啊
    CodeCodeStudy
        14
    CodeCodeStudy  
       2020-06-12 10:15:24 +08:00
    那么多人学他那个教程?
    sudoy
        15
    sudoy  
       2020-06-12 12:45:51 +08:00
    想做教程,为啥不自己搭个网站做试验呢?拿别人地网站不管个人还是公司都不合适
    qq7790586
        16
    qq7790586  
       2020-06-12 14:13:14 +08:00
    借楼问下各位大雕,哪里有买 ddos 滴。[狗头]
    tanghongkai
        17
    tanghongkai  
       2020-06-12 18:00:58 +08:00
    @heiheidewo 先保证能上再说,v2 也套的 cf 没见谁有意见嘛 www
    crella
        18
    crella  
       2020-06-13 10:11:22 +08:00 via Android
    cbaigui.com 网页已能正常打开,主要收集妖怪的信息,每页 15 个妖怪,共 110 页还多,也存了一些其他文章。

    爬这些有什么用处?想不懂
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2593 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 11:06 · PVG 19:06 · LAX 03:06 · JFK 06:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.