V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
kveln
V2EX  ›  分享创造

我用 AI 开发了一个书签清理和统计的工具-懒猫书签清理,但你可能用不到。

  •  
  •   kveln · 4 天前 · 1010 次点击

    有多少人像我一样,把书签和稍后阅读这样的工具是区分来用的,浏览器的书签只用来保存那些我认为以后有用的网站,稍后阅读工具用来保存当下来不及阅读的文章,但是这样也会导致书签越来越多。

    在给 Tabmark-Bookmark New Tab 增加 [一键打开文件下所有的书签] 的功能后,我发现自己现在的书签已经有超过 800+个了,点开几个看看,有些网页已经打不开了,有些文件夹也是空的,不知道是什么时候添加的。浏览器的书签在不知不觉中已经塞满了各种“以后可能会访问”的网站。

    在搜索了书签清理工具后,发现几款工具用起来都差点意思,在 UI 交互上不太直观,而且书签失效的原因也对普通用户理解起来不太友好。恰巧正值年末,充斥着各种年终总结,那么能不能也对自己这么多年收藏的书签来一次年终总结呢?于是我花了几天,用 AI 做了个书签清理和分析的浏览器拓展,名字叫“懒猫书签清理”,当然 Logo 也是用 Midjourney 生成的。

     懒猫书签清理

     懒猫书签画像

    它能做什么?

    主要就是两个功能:

    帮你扫描失效书签

    • 检查哪些链接已经打不开了
    • 找出所有空的文件夹
    • 支持一键删除这些无用的书签和空文件夹
    • 扫描完还会告诉你具体原因,而不是一些简单的状态码。另外你也可以根据各种错误的类型来筛选再次重新确认。

    为了方便你筛选,在书签的 url 上 鼠标 hover 时,还能帮忙预览网站是否能打开(注意有些网站有跨域的限制,不能预览,请手动打开)

    生成你的书签画像

    这个功能纯属好玩。它会统计你的浏览器的书签数据(所有数据不会上传,都在本地),做成一份简单的报告:

    • 你从什么时候开始收藏书签
    • 你的书签和文件夹的数量
    • 最常收藏什么类型的网站
    • 收藏数量的变化趋势
    • 基于域名的收藏分析
    • 给你一个收藏家等级(从"入门收藏家"到"神级收藏家")

    在统计了这些收藏的网站之后,发现了一些有趣的数据。

    • 比如我最早的书签是 2015 年收藏的站酷,那个时候我还在大学,正在自学 UI;
    • 我收藏网站最多的类型是各种各样的博客,现在已经有 358 个链接了,大部分网站已经不更新或者是打不开了;
    • 作为一个产品经理,我收藏最多的网站从域名来看竟然是 Github🥲
    • 我收藏的网站有两个高峰期,一个是 2019 年,一个是 2024 年,这也刚好对应着我人生中的两次职业的变化。 所以从这些书签的数据,可能也能反映你的人生中的一些变化,或者唤起你的一些回忆。

    最后说两句 这个工具确实解决了我的书签清理和分析的需求。但老实说,它可能是那种你用一次可能就再也不会打开的工具-就像我们收藏的大多数书签一样

    如果你:

    • 收藏书签很多
    • 平常也有清理书签的习惯
    • 好奇自己的收藏习惯
    • 可以来试试我这个工具。

    相关链接:

    项目网站: https://www.ainewtab.app/LazyCat-Bookmark-Cleaner/zh-cn/

    Chrome 商店地址: https://chromewebstore.google.com/detail/lazycat-bookmark-cleaner/aeehapalakdoclgmfeondmephgiandef

    开源地址: https://github.com/Alanrk/LazyCat-Bookmark-Cleaner

    工具已经上架 Chrome 商店,也可以搜"懒猫书签清理"就能找到。如果你用了觉得有意思,欢迎来分享你的书签故事和体验建议。

    17 条回复    2025-01-02 17:03:05 +08:00
    ltaoo1o
        1
    ltaoo1o  
       4 天前
    很好用,就是有些网站不准确,比如 https://zimuku.org/ 这个,可以访问,但是扫描结果是 Page Not Found
    kveln
        2
    kveln  
    OP
       4 天前
    @ltaoo1o 奇怪,通过状态码返回的是 404
    w$ curl -I https://zimuku.org/
    HTTP/1.1 404 Not Found
    Server: nginx/1.14.0
    Date: Mon, 30 Dec 2024 03:05:53 GMT
    Content-Type: text/html
    Content-Length: 13066
    Connection: keep-alive
    Set-Cookie: security_session_verify=c8f416adae474a9e5c76897b1f9f875f; expires=Thu, 02-Jan-25 11:05:53 GMT; path=/; HttpOnly
    Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
    ltaoo1o
        3
    ltaoo1o  
       4 天前
    @kveln 那这是网站防爬机制了,没有输入验证码就 404 🤣
    kveln
        4
    kveln  
    OP
       4 天前
    @ltaoo1o 感谢解释,这个我还真不懂,这样的网站就只能手动检查了,确实是没招🥲
    CouleurVVEX
        5
    CouleurVVEX  
       3 天前
    可惜没火狐的
    kveln
        6
    kveln  
    OP
       3 天前
    @CouleurVVEX 火狐的用户多不多呀,我之前的书签标签页也有用户反馈说没有火狐平台的。不知道适配容不容易。
    sorakiseki
        7
    sorakiseki  
       3 天前
    希望支持火狐
    kveln
        8
    kveln  
    OP
       3 天前
    @sorakiseki 好的,收到👂
    pillarho
        9
    pillarho  
       3 天前
    直接 5 星好评支持
    kveln
        10
    kveln  
    OP
       3 天前
    @pillarho 感谢支持🎉
    Fxshiny
        12
    Fxshiny  
       23 小时 15 分钟前
    ![Clip_2025-01-02_13-12-38.jpg]( https://i.111666.bestundefined)4
    在用了
    kveln
        13
    kveln  
    OP
       23 小时 0 分钟前
    @Fxshiny 谢谢支持,不过好像看不到你贴上来的图片
    Fxshiny
        14
    Fxshiny  
       22 小时 45 分钟前
    话说,有个问题,能不能加上一个网址重复的 这样可以看到是否多加过标签?
    kveln
        15
    kveln  
    OP
       22 小时 9 分钟前
    @Fxshiny 代码中已经有重复网址相关的检测了,在画像哪里,我还没想好和现在的扫描页面怎么结合展示比较好
    Fxshiny
        16
    Fxshiny  
       20 小时 49 分钟前
    @kveln #15 是有,但是不能做到只保留一个,手机扫描相同文件,不是有保留的一个的吗,可以试试相同的列下来,选择保留
    kveln
        17
    kveln  
    OP
       19 小时 26 分钟前
    @Fxshiny 好建议,我看下怎么整合进我的页面中
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3535 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 04:29 · PVG 12:29 · LAX 20:29 · JFK 23:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.