V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Nile20
V2EX  ›  反馈

20210531: 站长能否考虑一下调整 V2EX 的文字审查规则?

  •  6
     
  •   Nile20 · 2022-12-23 22:05:28 +08:00 · 5273 次点击
    这是一个创建于 694 天前的主题,其中的信息可能已经有所发展或是发生改变。

    今天在 github 上看到一个独立博客的 awesome 汇总页面,偶然看到站长 @Livid 也在其中。于是找到了站长的博客。

    博客最后一篇博文的标题是一个日期,我看到的时候心想这肯定是个很重要的日子,好奇心促使我点开——

    https://livid.v2ex.com/diaries/2021/05/31/20210531.html

    这篇博文用英语写就,讲的是 V2EX 被 GFW 屏蔽的事。

    发这个主题是以为恰好今天两件事撞到一起了:在看到站长的这篇博文之前,我看到另外一个帖子 https://www.v2ex.com/t/904257 , 由于 OP 打“连花清瘟”发不出来,改用拼音,下面的回复有好几条都在吐槽 OP

    请容许我引用站长那篇博文中的一段文字

    In those sleepless nights, I lay on my bed and kept thinking about what is really blocked when we are talking about that wall and its blockage

    V2EX 是审查的受害者,但 V2EX 同时也应用了自己的审查规则。我时常看到一些帖子因为无法通过 V2EX 的审查而改用图片的形式发出,我自己也有回复因为不知道触发了什么规则而无法发出。当然我没有尝试重复发送或者改用图片的形式——发不出就算了。

    敏感词的存在使得用户为了绕过敏感词绞尽脑汁,最终发出来的文字不得不充满各种“通假”,通常会看起来很丑陋。虽然在墙内这样的情况太多了,但是在 V2EX——在我看来这里是有一个有质量的社区,希望能够不遇到这样的情形。

    我知道 V2EX 是一个个人站点,站长拥有充分的自由,很多措施是为了维护社区的质量。但是想做到高可靠地屏蔽特定词汇及其变体还是有点难的,最终用户还是会想办法绕过。既然如此,那不如考虑不使用敏感词,而是在发帖前告知规则并且加大对违规用户的处理力度。

    第 1 条附言  ·  2022-12-24 16:56:50 +08:00

    昨天这篇主题更多是一种感慨之作,今天看了一下大家的回复,总结一下自己的想法,帮助理解:

    • 这篇主题希望讨论一种不基于敏感词的审查模式,我个人认为是需要有某种审查规则来维护社区环境的,敏感词模式最省事,但是有一些问题:
      • 基于敏感词模式的审查并不能达到阻止内容表达的效果,反而使得表达形式支离破碎

      • 同上,如果阿sir找上门,并不会因为一个人用了别的形式绕开了敏感词就没事了

        最多是,假如有一个系统在监控着国内外各主要站点的文字内容,那么某些特定的词汇可能更容易被关注。这种情况下,我想这个系统应该也会同时去匹配敏感词的变体形式,就看谁思维扩散得远。

    第 2 条附言  ·  2022-12-24 21:24:34 +08:00
    非常感谢一些朋友的讨论,有一些更可行的方式是我没有想到的,比如直接将匹配到关键词的主题移动到水深火热。我设想的基于规则的模式确实有可行性问题,因为要花费很多精力处理一些可能毫无价值的主题。

    站长在#32 给了回复,我想我理解站长的答复了,这个主题得到了解答。
    57 条回复    2023-03-25 15:21:39 +08:00
    NEO17
        1
    NEO17  
       2022-12-23 22:09:28 +08:00
    支持 OP 的观点
    leavic
        2
    leavic  
       2022-12-23 22:20:29 +08:00
    而是在发帖前告知规则并且加大对违规用户的处理力度。
    =============
    我 tm 堂堂正正说中文怎么就违规了?
    hcsu
        3
    hcsu  
       2022-12-23 22:23:15 +08:00 via iPhone
    支持
    Nile20
        4
    Nile20  
    OP
       2022-12-23 22:28:02 +08:00
    @leavic 中文也可以用来攻击嘛,用来骂人和阴阳怪气的话杀伤力可强多了(当然可能是因为我看不懂英文的阴阳怪气)。有的主题或者回复完全只是为了拉踩和发泄情绪,这种确实可以划为违规
    aaaaaaaaa
        5
    aaaaaaaaa  
       2022-12-23 22:52:40 +08:00 via iPhone   ❤️ 2
    屠龙少年终成恶龙
    1423
        6
    1423  
       2022-12-23 23:13:04 +08:00   ❤️ 1
    https://www.bilibili.com/video/BV1L3411Q7Km
    推荐今天的睡前消息,似乎一定程度可以帮助解答这个问题
    etnperlong
        7
    etnperlong  
       2022-12-24 00:13:14 +08:00   ❤️ 4
    支持 OP
    V2EX 是被不透明规则所伤害的被审查者 但与此同时自己也做了用不透明规则伤害用户的审查者
    同时我无比反对敏感词 不说容易缩写绕过几乎无效 更重要的问题是他污染了我们使用的语言
    etnperlong
        8
    etnperlong  
       2022-12-24 00:15:49 +08:00   ❤️ 11
    同时我在这里公开一个我绕过 V2EX 敏感词 且不影响阅读的方法
    在词中间加上 零宽连字符(Zero Width Joiner)
    Unicode: U+200D

    希望站长永远不要修复这个“漏洞”
    sNullp
        9
    sNullp  
       2022-12-24 00:27:56 +08:00 via iPhone   ❤️ 3
    站长以前对此类问题的回复都是“请找一个没有 moderation 的成功论坛出来”“中国人就算在国外,也要遵守中国的法律”

    不过我基本同意搞审查,唯一要求的就是公开审查逻辑。
    salor
        10
    salor  
       2022-12-24 00:54:06 +08:00 via iPhone
    2022.12.15 和 16 号两天大陆可以直接访问,我用 ping.pe 查过,v2ex 至少在这两天短暂解封过。

    我的理解是保留内容审查会有解封的时候,站长还是希望迎来彻底解封的那一天,毕竟广告收入不算少。
    hostloc 不知道都进进出出多少回了,被墙不是永久的。
    deorth
        11
    deorth  
       2022-12-24 01:39:57 +08:00 via Android
    加大力度
    clearc
        12
    clearc  
       2022-12-24 02:59:35 +08:00 via iPhone   ❤️ 1
    只要存在审查,审查规则就不可能公开,这是一体两面。

    社区类平台有个不可能三角:

    无审查发言、高品质讨论、大众用户 /无门槛使用。

    可以回想下知乎是怎么从精英知识社区沦落的,可能是三个都没做好。

    但是,审查不代表对敏感词的滥用,这是另外一套逻辑。之前以迁入国内为由要手机号后来又迁出依然选择保留,这就是权力的滑坡(参考上海世博以前地铁是没有安检的),所以我支持 lz 。
    ispinfx
        13
    ispinfx  
       2022-12-24 08:23:48 +08:00 via iPhone   ❤️ 1
    说得很好,下次别说了。。
    lhbc
        14
    lhbc  
       2022-12-24 09:01:25 +08:00 via Android
    敏感词过滤这种手段已经比较初级了
    审查就是要不公开关键词,通过 shadowban 、封号等不透明规则让你们自我审查,才是审查的高级形式

    自我审查才是最好的审查
    vsitebon
        15
    vsitebon  
       2022-12-24 09:45:13 +08:00
    敏感词可以用程序自动判断,加大力度需要人来处理,站长就一个人,也不太可能顾着几百个帖子
    cuebyte
        16
    cuebyte  
       2022-12-24 10:24:43 +08:00
    支持 OP
    wdssmq
        17
    wdssmq  
       2022-12-24 11:35:47 +08:00
    Save 式审查是真的超级无语。。
    neptuno
        18
    neptuno  
       2022-12-24 13:25:32 +08:00 via iPhone   ❤️ 1
    到时候抓得是站长,又不是你
    Nile20
        19
    Nile20  
    OP
       2022-12-24 14:30:01 +08:00
    @salor 目前的状态应该是不会解封的,我理解要回到墙内首先要备案,但是 V2EX 之前备案过后来又撤了
    Nile20
        20
    Nile20  
    OP
       2022-12-24 14:34:22 +08:00
    @clearc 确实,审查的意义在于它的规则是黑箱。我认可的审查更类似一种“社区规则”,比如 V2EX 的“好好说话”,而不是敏感词系统。敏感词大多数时候并不能阻碍内容表达,反而让文字变得丑陋,我认为对社区质量是有害的
    Nile20
        21
    Nile20  
    OP
       2022-12-24 14:36:05 +08:00
    @vsitebon 敏感词确实便于自动处理,但是并不能阻止内容被发出,损害了形式但是却无助于对内容的筛选
    Nile20
        22
    Nile20  
    OP
       2022-12-24 14:37:53 +08:00
    @neptuno 提升一下阅读理解水平?
    k9982874
        23
    k9982874  
       2022-12-24 15:24:11 +08:00 via Android   ❤️ 3
    其实很久之前就看到有人强调过而且不止一次强调过,v2 是个人站,不喜就请离开,留下就遵守规则。
    另外,审查一定程度上也是对网站和用户的双向保护。因为失去审查时,当某天👮找上门来,站长肯定会毫不犹豫的把你的信息提供出去,不要妄想什么为目田而抗争,你并不比站长的家人朋友重要,站长肉翻了,但他的家人还在国内。
    Nile20
        24
    Nile20  
    OP
       2022-12-24 16:08:02 +08:00   ❤️ 1
    @k9982874 在我看来你并没有读完我的主题,或者你只是用眼睛看了但是并没有去理解:我并没有反对 V2EX 进行审查,相反,我认为为了保持 V2EX 的社区质量,审查是必要的。我只是认为基于敏感词形式的审查并没有达到阻拦内容的效果,还使得内容表达形式支离破碎,因此希望能够探讨一种不基于敏感词的审查形式。
    Nile20
        25
    Nile20  
    OP
       2022-12-24 16:19:21 +08:00   ❤️ 3
    @k9982874 比如你这条回复里的“目田”,我一开始以为是“目的”,是你打错了,我发完上一条回复才反应过来,你要打的是“自由”。你为了规避敏感词审查而打成了“目田”,当然最终,你的内容也传达了,因为我理解了你是想说“自由”,但是是以“目田”的形式。我一直记得 V2EX“好好说话”的指引,并且认为这是一个很好的指引:我有一点想法,于是我遵守这个指引发了这个主题。如果 V2EX 不欢迎任何建议,我想也不会有这个反馈分区。最后的最后,我的这个回复里包含了“自由”这个词,发这个回复也是一个测试:我想看一下,如果你的回复里的“目田”用了它本来的形式:“自由”,是不是回复就发不出来了
    Andreas8
        26
    Andreas8  
       2022-12-24 16:21:55 +08:00 via iPhone
    打不出来是因为账号权限低
    wonderfulcxm
        27
    wonderfulcxm  
       2022-12-24 16:27:02 +08:00 via iPhone
    我估计站长只是懒,觉得麻烦,对研究审核机制没什么兴趣,或者觉得这不重要,索性用这种简单粗暴的方法。
    最近读到一本书,它说重要的事情认真做,麻烦的事情简单化,也是一种人生哲学。
    Andreas8
        28
    Andreas8  
       2022-12-24 16:29:32 +08:00 via iPhone   ❤️ 1
    发贴前先颅内审查下,我打的这个字会不会敏感🤣很久不逛贴吧,早上去贴吧找手机套餐,现在贴吧文化基本都是表情符号形声字,没点功底根本看不懂他们在说什么
    wonderfulcxm
        29
    wonderfulcxm  
       2022-12-24 16:34:11 +08:00 via iPhone
    @etnperlong 哈哈,那可以写个油猴脚本在回复的字符间自动加入零宽字符,实现了回复自由。
    SenLief
        30
    SenLief  
       2022-12-24 17:04:50 +08:00 via iPhone   ❤️ 2
    我觉得不屏蔽敏感词,而是把敏感贴直接移动到水深火热就可以了,有敏感词的直接移,不需要敏感了。
    mmdsun
        31
    mmdsun  
       2022-12-24 17:47:33 +08:00 via iPhone
    因为站长想某天恢复屏蔽吧!自从被墙了之后,v 站流量比以前少了一大截。屏蔽词有必要,我不想看到乌烟瘴气的政治讨论。
    Livid
        32
    Livid  
    MOD
       2022-12-24 18:13:49 +08:00   ❤️ 1
    有这样一个网站,前端技术很现代,上面的主要内容是中文的,同时你在上面发任何内容有完全的自由:

    https://matters.news

    去体验一下吧。
    Nile20
        33
    Nile20  
    OP
       2022-12-24 18:17:46 +08:00
    @Livid 感谢答复
    mnssbe
        34
    mnssbe  
       2022-12-24 18:39:23 +08:00
    审查你是为你好, 少喝点茶, 少挨点打

    电报审查小, 发言比较自由, 不过好多人进去了
    5G
        35
    5G  
       2022-12-24 18:39:48 +08:00
    推荐的这网站看起来就是个不依托于微信的公众号订阅集合站,压根就不是一个类型的网站,没意思
    Livid
        36
    Livid  
    MOD
       2022-12-24 18:47:29 +08:00   ❤️ 2
    @SenLief 我为什么要花大量时间去阅读和处理我个人并不感兴趣的内容?

    建立和维护这个网站的初衷,并不是为了讨论任何国家的任何政治内容。
    Jooooooooo
        37
    Jooooooooo  
       2022-12-24 18:48:41 +08:00
    站长也在另外一个地方提过, 你们想发而发不出去的内容, 网络上已经有非常多地方可以发了, 不差这里.
    irainsoft
        38
    irainsoft  
       2022-12-24 18:55:58 +08:00   ❤️ 1
    社区大了,没脑子的人也就会多了。中文社区里总是会看见一些原本还算是正常的主题,因为某一个回复而歪楼,然后走向了预期外的敏感话题。我也讨厌打不出一些词,但也知道有那一批词屏蔽掉会少掉很多愚蠢的争吵。问题不在于某一个站点或者某一个屏蔽规则,在于人。

    楼主提到的 /t/904257 其实就是一个例子,就算那个药品不在屏蔽列表中,那个主题帖就有什么实际意义吗?问出的问题明明可以直接去搜索,但非要发出来引战。如果那样的一帖在微博上没有被审查机制给删掉,评论区怕不是看了脑溢血。
    SenLief
        39
    SenLief  
       2022-12-24 19:08:06 +08:00
    @Livid 我的意思和这差不多啊,就是这些内容不应该出现在主页,直接发完贴就移动到一个固定的垃圾回收节点算了。话说敏感词的审查是有的,那能不能提供一个主动过滤的?
    x86
        40
    x86  
       2022-12-24 19:24:02 +08:00 via iPad
    突然发现深圳电信没开梯子就直接连上来了
    Daitabashi
        41
    Daitabashi  
       2022-12-24 19:43:18 +08:00
    正确的方式可能会是在触发敏感词后明确告知敏感词,并明确警告任何试图绕过敏感词系统表达原义的尝试将与直接发表敏感词收到同样的处罚(这点上还需要事先明确到底是什么样的处罚)。
    如果站长愿意的话,还可以去检查曾经触发警告的人到底有没有头铁去搞什么拉丁化或者通假字。
    512357301
        42
    512357301  
       2022-12-24 19:45:41 +08:00 via Android
    @Livid MOD 啊,这个网站真猛啊(看到繁体的那一刻就感觉不对劲,看到具体的一些帖子就感觉更不对劲了),唉,还是老老实实的搞技术搞妹子吧,不聊政治保平安。。。
    Livid
        43
    Livid  
    MOD
       2022-12-24 19:59:22 +08:00
    @Daitabashi 越“正确”的方式是不是需要花在上面的研发时间也就越多?
    Daitabashi
        44
    Daitabashi  
       2022-12-24 20:12:50 +08:00
    @Livid 想要让一群来自天南海北的人坐到一起“好好说话”本来就需要花费一些力气。没有花更多的力气,也就自然会存在拼音或通假字这些“不好好说话”的问题。
    Livid
        45
    Livid  
    MOD
       2022-12-24 20:17:15 +08:00
    @Daitabashi 那些会触发自动阻挡规则的输入内容,多半是某些人名及及其各种变体,或者各种 Netflix 合租之类。

    会有误伤,我也经常会收到各种关于误伤的反馈邮件,也一直都在调整。

    但关于那些人名,我也不知道有什么精细的方式能完美处理。我不想花时间在这些事情上。
    shinession
        46
    shinession  
       2022-12-24 20:20:24 +08:00
    个人网站, 大家只能建议, 听不听是另外一回事.
    我个人觉得自我审查不可取, 会增加站长工作量, 封号啥的, 况且互联网是有记忆的,有些东西发出来以后再封就有点晚了, 谐音还是加字符绕过那是另外一回事, 起码发出来的时候帖子是没什么问题的.
    sillydaddy
        47
    sillydaddy  
       2022-12-24 20:25:39 +08:00 via Android   ❤️ 1
    楼主的疑惑解决了吗?我试着说一下自己的理解。

    楼主说的基于规则的审查,目标是挺好的,但现实中可行吗?

    现在作个假设,比如现在你是站长,定义了一个新规则,每发一个涉及政治讨论的,帖子直接 404 ,发帖人禁言一个月,降权两个单位,回帖人禁言三天,降权一个单位。并且你将新规则在 v 站置顶公开。
    那么现在,作为站长,你要考虑新规则会带来什么影响吗?我想肯定需要考虑,毕竟 v 站是你引以为自豪的作品,且还是盈利的。那么你能确定这些新规则会带来的后果吗?比如在线人数因此大幅变动,可能上升到了每天在线 10000 人,也可能是下降到每天 2000 人。如果结果不如你所想,你还能坚持这个新规则吗,要不要考虑再把规则改回去呢?即使改回去,频繁改动规则这种行为又会不会引发什么连锁反应呢?面对这种不确定性,你有勇气发布这些新规则吗?
    我觉得规则重构对于 v 站来说,风险确实有些大,不到万不得已,冒险行为是个很难的决定。哪怕是规则迭代也没那么容易。

    而且也说不定站长觉得现状还不错,毕竟讨论水深火热也是人性:水深火热区平均每个帖子的回复数大概是 40 多个,是 v 站平均回复数的 4 倍,水深火热区用 1%左右的帖子数吸引了接近 4%的回复数。。更不要提其他的在你看来可能也需要审查的节点。站长也不能打败人性,也要作出妥协。
    Livid
        48
    Livid  
    MOD
       2022-12-24 20:30:29 +08:00
    @sillydaddy

    很多时候是因为处理晚了,所以会有那么多回复。移动进去之后通常就消停了。

    我没有时间整天盯着所有的新内容。
    salor
        49
    salor  
       2022-12-24 20:34:11 +08:00 via iPhone
    salor
        50
    salor  
       2022-12-24 20:36:06 +08:00
    Livid
        51
    Livid  
    MOD
       2022-12-24 20:36:55 +08:00   ❤️ 12
    在我目前还在使用的所有网站里,V2EX 可能是唯一的我还在用的中文网站了。

    简体中文作为一种语言,在过去十多年里所陆续遭遇的事情,我觉得挺难过的。

    而人生很短,我只想用尽可能多的时间去追求一些自己真正感兴趣的事情。

    当我们给别人建议的时候,最好是给那种自己确实尝试过并且有用的,对吧?否则就只是一些想象了。
    Nile20
        52
    Nile20  
    OP
       2022-12-24 21:13:34 +08:00
    @salor #48 我#19 的理解可能不对,但是我想我仍然在保持一种好好说话的态度,不知道你的这句“你开心就好”从何而来
    x86
        53
    x86  
       2022-12-24 21:23:18 +08:00 via iPhone
    @x86
    奇怪了,iPad 下直接上 V 站,iPhone 不行(同一个 wifi 下都是用 Chrome )
    Nile20
        54
    Nile20  
    OP
       2022-12-24 21:47:02 +08:00   ❤️ 1
    @Livid 我之前看到站长你在#32 的答复了,我想我理解了你的意思。不过后来的#50 这条似乎也是回复我的:
    我也对简体中文的现状感到难过,我发这个主题所追求的,正是基于这样一种心情。
    V2EX 保持在自己的路线上挺好的,毕竟大家上 V2 不是为了看政治讨论。
    最后,我在主题里提的方法确实有可行性问题,但是有一些情形是无法先尝试的。感谢站长你的时间。
    Livid
        55
    Livid  
    MOD
       2022-12-24 21:58:54 +08:00   ❤️ 1
    另外一种可能,就是每个人都 100% 掌握自己的数据:

    https://olivida.eth.limo/D2FC97F4-4F27-4FE2-A6BE-12C8DF44BBC1/

    从域名到内容的存储。
    AlphaTauriHonda
        56
    AlphaTauriHonda  
       2022-12-25 05:42:30 +08:00 via iPhone
    @salor 这张图的意思是网站没被墙?你可能理解错了墙的工作方式。

    @Livid 早点睡啊,起床太晚了。注意身体。
    xavierskip
        57
    xavierskip  
       2023-03-25 15:21:39 +08:00
    我只想到国内煎蛋网坚持了这么多年的无聊图板块没有倒掉真不容易。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1471 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 17:29 · PVG 01:29 · LAX 09:29 · JFK 12:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.