V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
SingeeKing
V2EX  ›  阅读

(纯吐槽)微信读书网页版为啥要做加密啊

  •  
  •   SingeeKing · 23 小时 49 分钟前 · 1602 次点击
    我知道是为了防盗版,但是 epub / pdf 满天飞的情况下,真的会有人去费力不讨好爬微信读书网页版吗,退一步就算想从微信网页版去获得书籍源文件,也应该不至于去模拟人工一页页爬吧,JS 逆向或者从网络包分析应该更合理啊

    但是这个加密就让想用/写个插件的我很难受了;各种划词工具用不了,最近想写个 AI Research 工具也无解……
    16 条回复    2025-02-04 13:15:50 +08:00
    Cheons
        1
    Cheons  
       23 小时 44 分钟前 via Android

    我很疑惑
    Kite6
        2
    Kite6  
       23 小时 17 分钟前 via Android   ❤️ 1
    如果它不加密,马上就有人爬(正版肯定校对过,和满天飞的盗版质量还是不一样的)。对比一下番茄小说,一样加密。
    SingeeKing
        3
    SingeeKing  
    OP
       22 小时 42 分钟前 via iPhone
    @Kite6 可是电子书这东西和小说不一样哇,就算爬下来了真的有人会去看 txt 格式的电子书吗…
    SingeeKing
        4
    SingeeKing  
    OP
       22 小时 41 分钟前 via iPhone
    至少我觉得我肯定会在扫描版本 pdf 和盗版 txt 二者中选择前者
    mooyo
        5
    mooyo  
       21 小时 45 分钟前   ❤️ 1
    微信读书上还有很多连载网文。。。
    ZztGqk
        6
    ZztGqk  
       21 小时 27 分钟前 via iPhone
    换个思路,你也用 ocr ,这样有些没选中态的地方也可以用你的划词工具
    cxtrinityy
        7
    cxtrinityy  
       20 小时 49 分钟前 via Android
    暴露年龄系列,起点纵横 17k 刚建站那会儿,大家不都看的 txt ?盗版网文站现在还留着 txt 下载按钮呢,虽然没啥用
    passive
        8
    passive  
       20 小时 10 分钟前 via Android
    小说除了红楼梦我一直都看 txt 。

    专业书有数学公式和插图,才看 pdf 。
    ysc3839
        9
    ysc3839  
       18 小时 9 分钟前
    有的。比如 Google Play 有些图书是不给下载 epub 的,从网页版中就能很容易地获取内容。
    ysc3839
        10
    ysc3839  
       18 小时 7 分钟前
    @SingeeKing 大部分电子书又不需要排版,只需要拿到文本就行了。而且纯文本的 txt 也可以转成 epub ,epub 就是 zip 打包 html 。
    Vegetables
        11
    Vegetables  
       16 小时 47 分钟前 via Android
    我和 5 楼的意见一致去,感觉还是主要为了连载网文防盗,现在看网文订阅太贵了
    fpk5
        12
    fpk5  
       15 小时 4 分钟前
    @SingeeKing #3 超过一定长度的小说还真是 txt 的适应性最好,epub 放在有的设备上打开就卡死。网络小说我一直都是 txt 。
    shiji
        13
    shiji  
       14 小时 48 分钟前 via iPhone
    你太小瞧爬虫佬了。 他们连接近于垃圾的信息都要爬一爬,何况是书
    lpe234
        14
    lpe234  
       13 小时 31 分钟前
    京东阅读也有。之前研究过 web 版,解密相当简单,甚至 JS 文件里面还有注释...
    macaodoll
        15
    macaodoll  
       13 小时 3 分钟前 via Android
    为什么要加密,肯定是为了反爬虫,另外为什么要反爬虫,不光是为了保护他的电子书,更多的是防止别的,比如拿微信读书当公众号文章抓取
    yidev
        16
    yidev  
       11 小时 23 分钟前   ❤️ 1
    你不爬!=别人不爬
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1304 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 16:39 · PVG 00:39 · LAX 08:39 · JFK 11:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.