1
shzbkzo 2023-05-14 14:27:10 +08:00 24
别尬洗。
爬虫功能是今年三月份加了,早就不是学生了,现在作者自己开公司了 另外学生身份就可以做任何事了?学生可以是做坏事的挡箭牌? 一个帖子打开放着不关闭,v2ex-plus 以 20 秒一次的速度一直请求 v2 ,相当于 ddos 了吧 你不如直接说:中国人愿意用隐私换便捷 |
2
o4kj893hg 2023-05-14 14:31:32 +08:00 2
"可以远端控制的配置"
这一点还不严重? |
3
shalk 2023-05-14 14:32:55 +08:00
为了实现 vdaily ,在插件里加了一些不该有的功能。
通过客户端收集数据,这不是得同意嘛,各种软件都会说是否同意收集数据,用户什么什么改善? 为了统计小区什么地板畅销,就直接去每个人家里看看? |
4
wangritian 2023-05-14 14:43:43 +08:00
如果我是站长,可能会找一些朋友回传大量假数据给插件服务器,迫使他关闭这个功能
|
5
weijancc 2023-05-14 14:47:16 +08:00
程序员在国人中算在意隐私的群体吧, 不打算用隐私换便捷. 生气的原因可能不是在意作者的动机是否恶意, 而是侵犯了用户的隐私.
|
6
Bob0800 2023-05-14 14:48:31 +08:00
@wangritian 沟通无效再做这种事吧... 如果人家愿意关你又何必做这种事。
|
7
defunct9 2023-05-14 14:54:47 +08:00
吐一口老浓痰
|
8
dawn009 2023-05-14 14:55:30 +08:00 2
看到目前为止,进展挺顺利的。作者承诺停掉这个功能,站长部署了防御规则。
|
9
lwjef 2023-05-14 15:06:51 +08:00
插件作者就是作死,提供功能给用户是合理的,默认开启完全不能做。
分布式爬虫还是太骚了,更骚的不仅用户端爬当前页还会爬未浏览页面。 说到不牵涉隐私,用户的 ip 加浏览的页面不是隐私? 洗一下 @shzbkzo #1 20 秒是请求插件服务端。 https://www.v2ex.com/t/939839#r_13072795 @wangritian #4 这么做给自己找不痛快,如果防爬难度太大会影响用户体验也很耗站长精力。 |
10
shzbkzo 2023-05-14 15:17:22 +08:00
@lwjef 洗不了哦
https://www.v2ex.com/t/939839#r_13072767 这个回复有详细的爬取步骤 第一步,请求插件服务端的 /api/topic/task 接口,接口返回值是{"sign":"646052931b3e3ac3cf9cd9f3","id":785109,"page":1,"url":"/t/785109?p=1"},url 的内容就是帖子 id 第二步,爬取 url 对应的帖子内容 第三步,将爬取到的帖子内容提交到 api/topic/info?task=hash 值这个接口 另外,你发的 https://www.v2ex.com/t/939839#r_13072795 这个回复的贴图,只看到 task 请求,是因为他只筛选了 task 请求 |
11
byteroam 2023-05-14 15:45:50 +08:00 2
多大个事,大公司这么干的多了,大家屁都不敢放一个,欺负个人也不用太过分啦,还是要给个改正的机会
|
12
ryd994 2023-05-14 15:45:59 +08:00 via Android 3
@lwjef 他代码有 bug ,说的是 30 秒一次最多 3 次。实际上次数限制代码错的,是 30 秒一次无限重复。每次请求有 30%的概率返回任务,那就算是 90 秒一个任务,如果有人网页没关,一天下来的请求量也很恐怖了。
作者当然说是无意中写的 bug 。但是对于灰产相关,我一向不吝以最大的恶意去揣测,再考虑默认启用而不通知用户。即使整件事都是无心之失,作者依然难辞其咎。 我认为,作者现在应该做的,不是去澄清什么有意无意,而是先把脚本下架,替换成空脚本。自动更新会帮助大部分用户解决问题。原始代码保留以备大家检验。服务器端亦然。事情搞到这个地步,这个产品就已经废了,想挽救也是枉然。 先好好认个错,这才是最大的诚意。有意还是无意,根本不是重点。 |
13
lwjef 2023-05-14 15:51:44 +08:00
@byteroam #11 抱怨的人可太多了,大公司它不改法律也不制裁它能有啥办法,插件作者这些行为有人抱怨反感是应该的,至于有些细节上误解的或者不礼貌的的确没太大办法。
不知道下面这个算屁吗。 cookie 技术与隐私权纠纷第一案——法院为何判百度不侵权? - 案例分析 - 新闻资讯 - 知识产权司法保护网(知产法网) http://www.chinaiprlaw.com/index.php?id=2024 |
14
Alfie007 2023-05-14 15:52:51 +08:00 via iPhone
还好我是没用
|
15
diagnostics 2023-05-14 16:38:53 +08:00 1
用 V2EX PLUS 就是用个楼中楼功能罢了,换成 V2EX POLISH 完全平替,简单用了看起来也没爬虫的东西,UI 还更好,设计还更好。为啥我还要用 PLUS 呢?
“人本性非恶”就是扯淡的,尤其是在中国这个环境下,只要能有利益,什么道德统统不存在,你忘记 996 了? |
16
diagnostics 2023-05-14 16:43:46 +08:00
|
17
november 2023-05-14 16:50:52 +08:00 3
这都可以洗?
“相信作者的论述”是什么意思?好像没人说作者说谎了啊。 而且你用了“疑义”这词来形容那个帖子,是说爬虫这件事真假还有带商榷? 不管是爬虫任务,还是作者声称关闭了爬取却依然再爬,甚至是作者声称只多 2-3 个请求却是平均 20s 一个,这些哪个是错的? 那你说相信作者,也就是说你认为 v2er 说的“没有关闭爬虫,平均 20s 一个请求”都是诬陷的? 利益不相关,没有用这个插件。只是没想到这都可以洗。 |
18
taine221 2023-05-14 17:35:34 +08:00
OP 可能是反串,本来觉得作者可能存在 ”心大“ 的成分
现在尬洗一下,直接感觉就是故意的,拜拜了您嘞 |
19
siweipancc 2023-05-14 19:21:47 +08:00 via iPhone
跳出来逼人拉黑?演员?
|
20
levelworm 2023-05-14 19:30:12 +08:00 via Android
@byteroam 也不是啦,大家喷腾讯啊什么的也是经常喷,只不过没法定位到个人,所以马和张就是主角了。楼主说的这个大家可以定位到个人,总不能说是谁逼迫他开发的吧?所以就直接喷个人了。
|
21
yolee599 2023-05-14 20:25:23 +08:00 via Android
爬虫默认开启,没有一点坏心思我是不信的
|
22
azure2023us559 2023-05-14 22:24:16 +08:00 via Android
花里胡哨的东西,不用不就完了。
|
23
wjx0912 2023-05-15 09:11:51 +08:00
虽然不用这个插件,大家点到即止。360 腾讯百度哪个干的不是这个的千百倍
|
24
coolloves 2023-05-15 09:30:16 +08:00
已经养成习惯,下油猴脚本,先看代码的 xhr 请求了.有外域的,仔细看下
|
25
encro 2023-05-15 10:02:05 +08:00
最近 V2EX 流行公关文,反转?
|
26
xubingok 2023-05-15 10:37:03 +08:00
利益不相关,也没用过这个插件.
我说评论的各位哟,都已经先入为主的戴上"灰产"的帽子去看待这个事情,那还有什么好说的. 至于是不是灰产呢?这个很容易判断吧? |
28
encro 2023-05-15 11:20:28 +08:00
@ohwind
你说得对,看太多了。活了几十年,类似混淆视听,故意搅乱是非的案例见太多了,小到个人,大到国家。。。 比如 v 站前面 python 书纸薄的,某跑路的机场,某卖水果的... 事实怎么样无法辨别,作为消费者,我认为正确的选择就是 --- 避坑。 我只是发表我的感叹,我认为我无法已无法辨别,因为获取的信息很片面, 所以我认为我们不要去看个别的情,而是事情的合理合法。 听其言,观其行吧。不宜过早下结论。对于任何下结论的,我们都需要持怀疑态度。。。 “也欢迎被打脸” 呵呵。。。 |
29
LaGeNanRen 2023-05-15 11:22:31 +08:00
《我是学生,再给我 50 》
|
30
ohwind 2023-05-15 11:44:07 +08:00
@encro 有没有一种可能,既然这个插件是开源的,你完全可以去对照源码去看这篇“公关文”的合理性?你既不愿意看源码自己分析,又不愿意听别人的分析,还要说别人是公关文,你这样是否有点不太合适?
|
31
encro 2023-05-15 12:00:33 +08:00
@ohwind
所以,我打了个问号。 是你帮我拉直作为肯定,我没肯定,我只是发表我对文章的疑问而已。 对于这个插件,我没有结论,我没有用过这个插件,也没看源码,以后也不会看,只是发表下个人感慨:最近反转文看的比较多,一个东西一旦多起来,那么究竟是大家都独立思考,还是有人故意混淆视听,就得好好辨别了。 确实因为表达不当,让其它人对这个插件和文章产生负面看法,表示抱歉。 |
32
cdswyda 2023-05-15 12:22:13 +08:00
第一,客户端进行这个操作,本质上很危险,用户的所有信息对他都是透明的,让用户完全信赖他,有点难。
第二,默认开启,且没有明显提示说明,比较不能接受。 我没用过,但是我认为这个行为约等于黑产 |