V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ycy9808
V2EX  ›  程序员

有没有什么工具能根据我的兴趣,自动刷知乎、V2EX 等网站并筛选感兴趣的帖子?

  •  
  •   ycy9808 · 1 天前 · 2935 次点击
    现在发现获取碎片化的信息太费时间,和我玩游戏的时间有点冲突。

    虽然这些网站提供了 RSS 功能或者栏目订阅,但我发现一个问题:

    即便已经订阅了某个话题或板块,里面推送的内容也有很大一部分并不是我真正关心的。而且推送的内容质量参差不齐。

    所以我在想,有没有现成的工具或者框架,能够实现这些功能:

    1 、定时访问指定网站;

    2 、按关键词、标签、标题内容等进行初步筛选;

    3 、最好能用 AI 来判断这篇帖子我可能是否感兴趣;

    4 、最后把这些内容以每日或者汇总的形式,推送到邮箱。

    有没有大佬已经搭建过类似的东西,能省去每天翻几十篇没兴趣内容的时间,不知道大家有没有这样的需求。
    26 条回复    2025-04-14 01:46:03 +08:00
    yb2313
        1
    yb2313  
       1 天前
    我也在想自己整一个项目来搞这个, 用 py 做爬虫, 然后前端展示, 后端可能用 rust 或者 c#,go, 筛选条件还是用 py 写比较方便, 猜测有很多包比较方便
    shendaowu
        2
    shendaowu  
       1 天前
    Mem0 也许能实现这个功能?“自适应个性化:根据用户交互不断改进,提供精准个性化记忆。” “Mem0 可以显著提升个性化 AI 的能力。通过记住用户的偏好等用户画像信息,AI 产品就可以提供更加个性化服务,有较好的想象空间。”https://www.cnblogs.com/xiaoqi/p/18315502/mem0

    另外 OP 刷这些东西的主要目的是什么?我属于手里拿着“XY 问题”,看谁都在犯这个毛病。比如如果 OP 是想扩展知识面的话,也许看“牛津通识读本”或者各学科的导论效果会更好一些。如果是想紧跟时事的话,订阅一些相关的正经媒体也许更好。
    DIO
        3
    DIO  
       1 天前
    建议直接基于 RSS 的搞,爬虫项目一般是弃坑跑路最快的
    lekai63
        4
    lekai63  
       1 天前 via iPhone   ❤️ 2
    你这需求 不是又回到算法推荐了吗

    无非是本来平台出算法 现在你想自建
    renmu
        5
    renmu  
       1 天前 via Android
    不看立省
    shendaowu
        6
    shendaowu  
       1 天前   ❤️ 2
    @lekai63 #4 平台跟用户一般有利益冲突。平台想要用户不停地刷刷刷。用户想要自己真正感兴趣的,并且不想一直刷刷刷。
    IndexOutOfBounds
        7
    IndexOutOfBounds  
       1 天前
    楼主看下我这个是否满足你的需求,基于 RSS 的
    https://www.v2ex.com/t/1119444

    不过现在还没出来,拖了比较久,现在在写 README &测试阶段
    musi
        8
    musi  
       1 天前
    @DIO #3 国内很多平台本并不提供 RSS 订阅,所以大多数平台的 RSS 也就是个爬虫
    2333wz
        9
    2333wz  
       1 天前   ❤️ 1
    我每次大会员断供 B 站就给我推送想看的会员限定
    yb2313
        10
    yb2313  
       1 天前
    主要是自己看的平台就那么几个, 直接操作浏览器不停往数据库存就行了, 速度也不用很快, 自己看不完, 然后自己根据任意条件筛选掉不喜欢的, 对接 ai 也很方便
    bantianys
        11
    bantianys  
       1 天前
    https://newsnow.busiyi.world/c/hottest
    这个是开源的项目,自己改下,用 LLM 的 API 过滤。具体代码怎么改可以用 cursor 根据整个 CodeBase 辅助你修改。
    SmiteChow
        12
    SmiteChow  
       1 天前   ❤️ 7
    自建的信息茧房它就不是茧房了吗?
    mumbler
        13
    mumbler  
       1 天前   ❤️ 1
    不就是今日头条么
    opengps
        14
    opengps  
       1 天前
    你是想玩游戏,但惦记着刷资讯。“看山不是山,看水不是水”
    Gilfoyle26
        15
    Gilfoyle26  
       1 天前
    这不就是 抖音吗,反正都是打发时间,刷抖音和刷知乎、V2EX 等网站又有什么区别呢
    Pipecraft
        16
    Pipecraft  
       1 天前
    Feedly 的 AI feed 功能也许是你想要的。
    Librola
        17
    Librola  
       1 天前   ❤️ 1
    @SmiteChow 茧房总比茅厕好,有些平台的推荐简直是在压着你喂💩
    z1829909
        18
    z1829909  
       1 天前 via Android
    拒绝平台给你推送的流信息,自己主动去找一些想知道的信息。
    chqome
        19
    chqome  
       1 天前
    feedbro 可以根据关键词过滤掉不行看的内容
    hxy100
        20
    hxy100  
       1 天前
    何必自己造轮子,建议你多花点时间刷刷今日头条就行了。字节的算法向来很先进,会给你想要的。
    elffkdx
        21
    elffkdx  
       1 天前
    https://www.v2ex.com/t/1123085
    我也想要个这样的,就是这个 APP 可以抓取和收集任何信息,或者由用户产生,都可以。
    will800
        22
    will800  
       1 天前
    @hxy100 #20 今日头条上不是都是营销号吗,高质量内容只剩知乎和少数垂直论坛了
    smlcgx
        23
    smlcgx  
       1 天前 via iPhone
    @SmiteChow 我觉得不一定,要看信息源的质量。比如读 10 本高质量的书和刷 1000 个短视频相比,肯定是前者给人带来的收获更多一些
    aarontian
        24
    aarontian  
       23 小时 34 分钟前
    之前有考虑过,且不说推荐算法和成本问题,单数据获取就很难(爬虫是个体力活),最终大概率不如选个适合自己的平台+平台推荐
    abc8678
        25
    abc8678  
       6 小时 15 分钟前 via Android
    @SmiteChow 突然想起还在看本站和 IT 之家等的原因之一
    kneo
        26
    kneo  
       2 小时 53 分钟前 via Android
    是不是最好还能自动帮你阅读,阅读完告诉您今天收获满满。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   846 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 20:39 · PVG 04:39 · LAX 13:39 · JFK 16:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.