1
SniperXu 2020-11-24 14:11:08 +08:00
你要习惯。。。
|
2
hoyixi 2020-11-24 14:13:20 +08:00
现在还写博客都是雷 F
写完还把链接发在大站点炫耀 or 企图引流的,那是爬虫们的衣食父母 |
3
natashahollyz 2020-11-24 14:14:11 +08:00
禁止一下右键,如果别人实在要强行扒,那也没办法
|
4
no1xsyzy 2020-11-24 14:21:35 +08:00
@natashahollyz 防不了爬虫……
|
5
Jooooooooo 2020-11-24 14:22:54 +08:00
网上写东西要有这种觉悟
|
6
lizeze 2020-11-24 14:28:15 +08:00
能被人转也是一种认可
|
7
natashahollyz 2020-11-24 14:28:34 +08:00
@no1xsyzy 加干扰码?
|
8
dusays 2020-11-24 14:32:10 +08:00
正如一楼说的那样,要习惯啊!我可能比博主还惨,我算是一个写口水文的博主,博客是 dusays.com ~
偶尔突发奇想,写了一些自以为的精文,没过两天,就发现百度有收录,不过收录的却不是我的网站,一看就是被转走了~ 博主没写原文地址,还声明是原创,接下来就是重头了! 联系这些博主,各个振振有词。又说是自己原创的,拒绝承认转载。又说是用户投稿的,平台不管真实作者。更有甚者,直说盗你文是看得起你~ 我前段时间还发帖询问,全静态的博客,有没有办法加密 html 文件,但不影响浏览器的解析,因为我经常被扒站! |
9
GetMoney 2020-11-24 14:39:01 +08:00
付费阅读
|
11
HelloWorld556 OP @dusays 看了一下那个人的博客,搜了几篇文章标题,别处都有,估计大部分都是爬虫来的,可能也有你的
|
12
xuanbg 2020-11-24 14:43:03 +08:00
随便了。但写好文,不问剽窃。
|
13
airplayxcom 2020-11-24 16:32:02 +08:00 1
CSDN 微微一笑~
|
14
bequt 2020-11-24 16:45:30 +08:00
即使被转载, 写得多精彩, 最后也会都停留在你的博客上
|
15
wvidc 2020-11-24 17:15:38 +08:00
习惯就好,我们开发的小功能被人开着公司倒卖,也一样只能习惯着
|
17
cs419 2020-11-24 17:29:20 +08:00
网上公开的东西,人家想盗,自然拦不住
可以适当提高对方的盗取成本 博文里多加配图+水印 文章里穿插点 超链接 加上博客链接 加点空格隐写术 |
18
toomlo 2020-11-24 17:33:02 +08:00
你这还算好的,见过那种抄袭了还来你博客下面评论他抄袭的吗...
|
19
lovecy 2020-11-24 17:36:59 +08:00
确实,网上写东西要有觉悟。。
爬虫站 /爬虫号 /爬虫博+没有辨识能力的人很多,自己的东西变得不像自己的了很正常。。 |
20
Patrick95 2020-11-24 17:39:35 +08:00
等你洞察到网上采集站的规模之后
你就放宽心了 |
21
Lemeng 2020-11-24 17:52:29 +08:00
瞬间不开心了,哈哈哈,可爱
|
22
muzuiget 2020-11-24 18:21:29 +08:00
看开点算了,现在哪怕 Google 搜中文,前面结果也是各种内容农场的网站,本来通用搜索引擎就是垃圾了,你在怎么优化也是白搭,还不如用垂直搜索引擎好。
|
23
dustin2016 2020-11-24 18:29:38 +08:00
我之前的 wqordpress 博客也被人镜像了
用了十几种防止爬取和镜像的方法 目前,已放弃治疗😂 |
24
ob 2020-11-24 18:40:17 +08:00 via Android
把文字内容全部转成图片加水印,大家觉得怎么样?就不管爬虫了。。
|
25
fasionchan 2020-11-24 18:47:21 +08:00
@GetMoney 付费阅读也不能幸免……
我去年在慕课网写了一个 Python 源码剖析专栏: https://www.imooc.com/read/76 刚发表不久就发现被某些公众号抄了,只字未改…… 好在,微信公众平台上可以投诉,官方处理也快,不然真拿这些孙子没办法…… |
26
ragnaroks 2020-11-24 18:55:17 +08:00
匿名用户前 30%内容直接展现,后面内容需要登录可见
|
27
wenzichel 2020-11-24 18:59:20 +08:00
https://www.xiabingbao.com/post/blog/blog-be-cloned.html
曾经我的博客也被人爬过,是整站的爬下来。然后我就想着去工信部投诉这个网站,不过后面他把他网站上的内容给删了。 后来我就在 js 里加了一个域名的判断,如果是非自己的域名就跳转。就是不知道管不管用。 |
28
aristolochic 2020-11-24 19:34:41 +08:00
@dusays 不在乎 CDN 开销的话...可以用邪恶的私有字体。就是得费点儿劲。
大致就是字体和编号随机一对一重新排列,生成的 HTML 中的文本部分也做此处理 这种...也就别想被搜索引擎收录了 (不太清楚现在的采集站能不能发现 |
29
VgV 2020-11-24 19:36:41 +08:00
这种事情要淡定,如果不在乎搜索引擎可以把内容转为图片加水印。
|
30
Tyuans 2020-11-24 20:22:38 +08:00
看了看上面的,以后部分内容文字部分文字图片,倒是没什么用,也就是恶心恶心。
|
31
LiuSha 2020-11-24 20:23:52 +08:00 via Android
淡定,碰到好一点的会评论说自己转载的,坏的情况就是直接爬过去
|
33
dusays 2020-11-25 15:24:49 +08:00
@HelloWorld556 确实如此,不仅扒了我的内容,还有别人的站,就是个采集站,看到好的就扒!
|
35
dusays 2020-11-25 15:59:38 +08:00
@aristolochic 倒也不担心被采集,只是希望转载之后,可以保留版权,别伪原创~
|