V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
LeeReamond
V2EX  ›  程序员

提个问题,如果使用 Github 分享 e 绅士网站上抓取的信息,是否违反用户协议?

  •  
  •   LeeReamond · 2023-07-22 13:34:42 +08:00 · 1861 次点击
    这是一个创建于 483 天前的主题,其中的信息可能已经有所发展或是发生改变。

    起因是这些年断断续续在把喜欢的 e 绅士上的漫画下载到本地,(包括前几年 e 绅士也确实有一段时间要关站了),感觉还是下载吧。

    然后漫画变得有点多了以后,管理成了问题,因为一般都是种子下载的分成一个个独立文件夹的图片。网站上索引这些图片时是可以按作者搜索,按类别搜索等等的,windows 里本地看的话这些功能是啥也没有的。

    然后最近有点闲就撸了个类似于电影软件里刮削器的那种东西,原理就是在没有任何 meta 信息的条件下,通过识图来识别该文件夹下的图片是哪部漫画,然后再把所有 meta 信息给贴上去,印象中是有一些项目做了本地化根据 tag 管理漫画的功能的,也许可以对接。目前这部分还没做,只是单纯做了刮削的部分。

    我也不知道有没有什么第三方接口可以识图,我是干脆把全站的所有封面都下载到本地了,大概 50G 左右。

    想知道的一件事是,如果把这套东西,连带 e 绅士上爬取的 meta 信息全都上传到 github 的话,emmm 我想还是有人需要的,只不过这是否违反 gh 用户协议?各种意义上

    9 条回复    2023-07-23 07:47:03 +08:00
    cmdOptionKana
        1
    cmdOptionKana  
       2023-07-22 13:42:27 +08:00
    我的看法,所谓用户协议,如果不涉及金钱费用,绝大多数情况下只是一个大方向,不可能在协议中写明千奇百怪的具体案例。

    因此,必然存在灰色地带,灰色地带是说不清的,有人说你对有人说你错,最终 github 官方怎么处理你,你想用协议来抗议是没用的。除非你能搞个大新闻,但这看运气,多少情况下没多少人关心你被处理,闹不起来。
    SunsetShimmer
        2
    SunsetShimmer  
       2023-07-22 14:16:22 +08:00   ❤️ 1
    Meta 或许可以,但图片本身不可以。

    https://docs.github.com/zh/site-policy/acceptable-use-policies/github-sexually-obscene-content

    “如果以性为主题的内容或性暗示的内容,其目的只是引起性反应或使人震惊,则不被允许,尤其是在通过将此类内容放置在个人资料或其他社交环境中而扩大影响的情况下。”
    NoOneNoBody
        3
    NoOneNoBody  
       2023-07-22 15:43:53 +08:00
    建议不要做这事

    非要做的话,建议脱离本地文件(脱敏)
    你可以离线提取图片特征,然后上线前把该图片替换为线上对应存在的 url (公开的),因为 url 需要保持长期稳定的话就只有官网了
    简单说就是不要提供图片本体
    但是这样的话,你的项目就不稳定了,可变因素太多

    我有个自用的人脸识别数据库,目前约有东亚几万女明星,还在增加,我也想分享,但不敢
    即使我不提供人脸图片本身,人脸特征也是隐私,我不可能获得这几万人的授权,公开的话会被告死的
    其实 github 上也有一些明星人脸库(其他国家),但这不足以成为我免责的理由,所以还是不冒险了
    不过,图片特征和人脸特征不是一回事,前者目前来说暂时没有法律问题

    另:
    我不知道这个漫画,更不知道其分级
    github 目前涉及裸露的素材的项目,其他用户都需要登录才可看到,一些 NSFW 项目的二次元图片,之前露点的现在都打了码,显然规则严格了很多
    yazinnnn
        4
    yazinnnn  
       2023-07-22 15:43:54 +08:00
    这种疑似侵权的东西不如换种方式分享, 比如 resilio sync
    kulous
        5
    kulous  
       2023-07-22 16:10:08 +08:00
    不是你的东西,你拿出来获利,或者别人通过的你的免费分享他用获利。都有可能被牵扯进去。而且你无力抵抗,也无法抵抗。就是为了有限的利益把自己推向了无限的风险里面去。
    kumiko
        6
    kumiko  
       2023-07-22 23:02:34 +08:00
    搞个 nas ,装个 lanraragi
    LeeReamond
        7
    LeeReamond  
    OP
       2023-07-23 00:49:29 +08:00
    @NoOneNoBody 脱敏确实是好方案,比如分享图片指纹算法以及计算后的指纹结果。

    不过我的想法是,指纹只是用来初步筛选图片相似度,后面为了计算具体相似性应该还需要有一个逐项素精确对比的过程,所以可能脱离不了源文件,图片当然基本都是 R18 的,按照你的说法确实不分享为好。


    @kumiko 有 NAS ,目前存储没问题,只是之前在想是不是要做好人,毕竟好人一生平安。


    @SunsetShimmer 看楼上写的还有一种分享方式是 github 上只传脱敏数据,敏感内容用网盘分享,但是我看了看你发的那个说明里的内容,感觉似乎这样也是不行
    DefoliationM
        8
    DefoliationM  
       2023-07-23 03:08:54 +08:00 via Android   ❤️ 1
    如果在大陆境内的话就别分享了,数量大的话可能会出事。
    keymao
        9
    keymao  
       2023-07-23 07:47:03 +08:00
    这东西,你下载到本地。 你其余多余的动作都是在推动你戴上银手镯。 自己乐呵就完了,被 kpi 狂热者抓到踪迹,你就毁球了 懂吧?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2800 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 05:44 · PVG 13:44 · LAX 21:44 · JFK 00:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.