V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Al0rid4l
V2EX  ›  问与答

迫于世界变化太快, 有哪些好的保存和整理分类网页内容的方案?

  •  1
     
  •   Al0rid4l · 2021-02-28 15:44:09 +08:00 · 3162 次点击
    这是一个创建于 1364 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近整理浏览器收藏夹, 发现很多以前收藏的技术 /人文社科的文章消失了, 或是随着个人博客的关闭而消失, 或是随着平台倒闭而消失, 或是其他众所周知的原因. 偶尔想看的时候发现没有了亦觉得很是可惜.

    其实从很早开始个人就不再信任他人的服务器, 尤其是在自己没有为其付费只是简单地点击一下收藏, 就指望他人能够很好地保存自己想要的信息, 是不切实际的. 获取并保存有价值的信息, 终究是有代价的, 或是金钱, 或是自己的时间. 也因此养成了对于自己觉得有价值的信息, 随手保存一份的习惯.

    最开始的方案很简单也很笨(可能现在也依然如此), 就是浏览器保存网页, 并用文件夹分类, 好处是最大程度保留了所有信息, 比如内容中的链接, 也方便需要的时候进行复制. 但是缺点也很多, 硬盘上大量小文件, 一个页面一个目录, 搜索起来也麻烦, 并且有些 js, css 等资源无法加载导致排版错乱.

    目前的方案是导出 PDF, 也能比较好地保留内容中的链接, 也比较方便复制文字, 并且没有太多小文件. 缺点是排版也可能有小幅错乱, 不过总体可以接受. 另外就是也不太方便搜索文本.

    对于不带链接的内容, 偶尔也会直接网页截图, 占用空间比较小, 但是无法复制搜索里面内容了.

    关于为什么不用 XX 笔记之类的方案, 如前所述不够信任, 另一方面有些是私有格式万一以后需要迁移也会比较麻烦.

    扯这么多, 主要是两个问题

    1. 有没有更好的保存网页内容的方案?
    2. 另外就是如何整理分类这些保存下来的内容了, 目前只能通过目录的形式分类, 但是这是树状的, 个人更希望是基于 Tag 的方式进行分类
    第 1 条附言  ·  2021-02-28 16:22:27 +08:00
    可能是没有表述清楚, 这里的「保存」特指保存在本地, 或者起码需要提供导出到本地的公开 /通用格式
    20 条回复    2021-03-01 08:21:21 +08:00
    EasonC
        1
    EasonC  
       2021-02-28 15:54:28 +08:00 via iPhone   ❤️ 1
    Pocket 是 Premium 自动存永久,网站挂了也在,但是如果付费中断 30 天会删除掉之前保存的。

    pinboard.in 的 pro 账号提供永久保存,老牌子了

    印象笔记直接网页剪辑到笔记里

    苹果用 Devonthink 也能永久,付费世界可及

    Diigo 也能永久保存,也是付费,去官网看看,不展开说了

    chrome 插件 SingleFile 下载离线本地化
    xunco
        2
    xunco  
       2021-02-28 16:01:43 +08:00
    换了很多,最后付费 raindrop.io 了,全平台,搜索能力强大,支持标签和子目录
    xarthur
        3
    xarthur  
       2021-02-28 16:17:18 +08:00   ❤️ 3
    我推荐 WebRecoder,支持动态网页甚至是纯 JS 的网站,而且现在支持上传到 IPFS 上。
    https://webrecorder.net/
    演示视频。
    AndyAO
        4
    AndyAO  
       2021-02-28 16:21:05 +08:00   ❤️ 2
    如果只是保存文章到本地,那么强烈推荐 MaoXian web clipper,支持 HTML 和 MarkDown,HTML 可以用 Word 直接打开,而 MarkDown 被支持更加广泛,例如可以直接用 Obsidian 打开做笔记,直接相互引用。
    Al0rid4l
        5
    Al0rid4l  
    OP
       2021-02-28 16:24:56 +08:00
    @EasonC
    「关于为什么不用 XX 笔记之类的方案, 如前所述不够信任, 另一方面有些是私有格式万一以后需要迁移也会比较麻烦.」
    以及见 append
    其他几个方案我去了解下
    ronman
        6
    ronman  
       2021-02-28 16:28:02 +08:00 via Android
    说一个不算好的办法,就是把你觉得有价值的文章 /内容自己做总结整理,然后保存到本地 /发布到自己博客站。
    essethon
        7
    essethon  
       2021-02-28 16:35:58 +08:00
    看到这贴之后试了一下 Command + S 直接保存,Safari 的 .webarchive 格式,然后断网打开,效果看上去蛮好的
    Kyon945
        8
    Kyon945  
       2021-02-28 18:44:30 +08:00 via iPhone   ❤️ 1
    网页剪藏靠的是:SingleFile 或者 简悦(浏览器扩展)完美保留原网页格式,存为离线 html (移动端也可以完美查看)

    网页做笔记:网页剪贴簿(浏览器扩展)
    mythabc
        9
    mythabc  
       2021-02-28 18:49:45 +08:00
    为知笔记 docker 版+剪藏授权服务。
    数据离线在自己的机子上,搜索和整理也方便。
    superrichman
        10
    superrichman  
       2021-02-28 19:01:53 +08:00 via iPhone
    自建 wallabag,可以设置 tag,也可以搜索。
    iConnect
        11
    iConnect  
       2021-02-28 19:04:58 +08:00 via Android
    虽然也经常收藏剪藏,后来发现几乎没有复用用过。需要的找类似资料的时候,还是直接搜索引擎😄
    ponycoding3
        12
    ponycoding3  
       2021-02-28 19:12:20 +08:00
    chrome 可以将网页保存成单文件的, 效果还行, 然后用 md 文件对已经保存的网页进行汇总整理, 用链接跳转.
    SJ2050cn
        13
    SJ2050cn  
       2021-02-28 21:07:49 +08:00
    可以试试插件 print friendly,edge 和 chrome 商店都有,导出 pdf 的格式挺好的,至于搜索那就用最原始的,根据用途建立文件夹,后面直接搜文件名就行,文件搜索的工具就很多了。
    bug403
        14
    bug403  
       2021-02-28 21:36:20 +08:00
    网页剪辑我用 OneNote
    loading
        15
    loading  
       2021-02-28 21:47:05 +08:00 via Android
    稍后阅=永不阅
    crab
        16
    crab  
       2021-02-28 21:49:21 +08:00
    直接另存为 mhtml 格式
    mmdsun
        17
    mmdsun  
       2021-03-01 00:14:04 +08:00 via Android
    OneNote 可以把网页存笔记
    yeqizhang
        18
    yeqizhang  
       2021-03-01 00:39:41 +08:00 via Android
    我尽量保存成普通文本,然后是 word html markdown,html 是用 singlefile 保存的,除非之后浏览器不兼容查看这些保存的文件了,就看不了了。
    wy7305e
        19
    wy7305e  
       2021-03-01 08:05:51 +08:00 via Android
    浏览器扩展 SingleFile
    caixiaomao
        20
    caixiaomao  
       2021-03-01 08:21:21 +08:00
    暂时用印象笔记的剪藏
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   921 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 22:19 · PVG 06:19 · LAX 14:19 · JFK 17:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.