V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
2232588429
V2EX  ›  问与答

feedly 抓取论坛帖子不是实时同步吗?

  •  
  •   2232588429 · 2016-08-09 23:06:11 +08:00 · 2254 次点击
    这是一个创建于 3028 天前的主题,其中的信息可能已经有所发展或是发生改变。
    一个论坛, RSS 搜索可以抓取,但是发现不少新发的贴没抓取到。
    17 条回复    2016-08-10 15:41:50 +08:00
    contactfront
        1
    contactfront  
       2016-08-09 23:11:17 +08:00
    Feedly 本来就不是实时的
    https://www.feedly.com/fetcher.html
    "Fetcher shouldn't retrieve feeds from most sites more than once every hour on average. "
    2232588429
        2
    2232588429  
    OP
       2016-08-09 23:14:00 +08:00
    @contactfront 那是一个什么原理呢?
    2232588429
        3
    2232588429  
    OP
       2016-08-09 23:24:39 +08:00
    大家有没有抓取效率高的 RSS 推荐?
    ranran
        4
    ranran  
       2016-08-10 00:23:49 +08:00
    一般好点的在线阅读器都支持 PubSubHubbub ,是可以实时收到的( V2EX 常见的几个都支持的)。但是这也需要网站方的支持。 V2EX 不支持……
    feedburner 的 Feed 支持 PubSubHubbub ,所以有个 feedburner 的 feed 地址, 5 分钟抓取一次 V2EX ,在线阅读器可以实时收到更新。

    http://feeds.feedburner.com/v2excom
    ranran
        5
    ranran  
       2016-08-10 00:49:09 +08:00
    我也用 feedly http://feeds.feedburner.com/v2excom 的更新挺快的
    LU35
        6
    LU35  
       2016-08-10 08:28:28 +08:00
    @2232588429 之前看了一篇官方 blog.大意是订阅越热门(越多的人使用)抓取频率就越高.
    LU35
        7
    LU35  
       2016-08-10 08:30:05 +08:00
    @ranran 如果你需要的是实时更新提醒,我觉得你需要的不是 RSS,而是 ifttt.
    ranran
        8
    ranran  
       2016-08-10 09:13:53 +08:00
    @LU35

    1.v2ex 的使用量并不小,但是抓取时间也不是很理想。
    2.“如果你需要的是实时更新提醒,我觉得你需要的不是 RSS,而是 ifttt.”, RSS 本身就是 HTTP 协议访问的, IFTTT 就能实时抓取了?哦,如果不是说 RSS ,那真是多得不得了,你没必要 @我来告诉我,这样我会觉得你认为我的回复是错的。但是对于 RSS 方面,我的回答毫无疑问是正确的。楼主问的也是 RSS 。 RSS 通过 PubSubHubbub 也可以获得实时更新。问题何在?
    3.我对 IFTTT 实在没什么好印象,以前建立的一个用来抓取 CHROME 新版本提醒的功能,后来莫名其妙就给我删除了。
    LU35
        9
    LU35  
       2016-08-10 09:40:14 +08:00
    @ranran
    1.我指的并不是 V2EX RSS 总使用,而是在 feedly 里订阅了 V2EX 的用户.不知道你从哪里得到的 V2EX 的使用量并不小,但是根据我平时使用 feedly 的情况,对比我订阅的其他冷门 rss 的抓取频率,使用 feedly 并订阅了 v2exRSS 的这个使用量很小.
    2.而求 RSS 协议本身就不是为了实时获取信息而设计的,本身是为了聚合经常发布更新数据的网站.另外楼上所说的 PubSubHubbub 并不是 RSS 协议的原生内容.而只是 Atom 和 RSS 的一个扩展,这个扩展需要提供订阅的网站支持才能实现,目前没发先几个支持 PubSubHubbub 的订阅源.你不能说某协议支持通过扩展来实现了一个功能就说这个协议本来就支持这个功能.
    ranran
        10
    ranran  
       2016-08-10 10:42:11 +08:00
    @LU35 我觉得你可能没认真看我的回复,我觉得我已经全面回答楼主的问题了,而你说的什么 IFTTT ,能订阅 V2EX ?或者别的。能支持 V2EX 吗?解决问题就说点实际的吧。
    LU35
        11
    LU35  
       2016-08-10 11:41:30 +08:00
    @ranran 你在搞笑?请问楼主的帖子里面哪个字在问订阅 V2EX?楼主说的是论坛,国内 99%的论坛使用的是 phpwind 和 Discuz! ,这两个论坛都可以使用 ifttt 订阅.
    另外你说的 V2EX 的订阅量不小抓取时间却不理想是从哪里看来的?
    还有你说的 RSS 通过 PubSubHubbub 也可以获得实时更新。问题何在? 我的问题是请你找出个支持 PubSubHubbub 的论坛,或者网站也可以.
    LU35
        12
    LU35  
       2016-08-10 11:44:43 +08:00
    @ranran 还有,你说的原话
    "一般好点的在线阅读器都支持 PubSubHubbub ",你搞清楚了没有?PubSubHubbub 首先需要的是订阅源支持 PubSubHubbub 扩展才可以实时更新.和你说的一般好点的在在线阅读器支持 PubSubHubbub 有毛的关系????????照你说的一般的好点的在线阅读器支持 PubSubHubbub 然后就算不管订阅源不提供 PubSubHubbub 支持也能提供实时更新?麻烦你回复前先好好看看 PubSubHubbub 的介绍!!!
    ranran
        13
    ranran  
       2016-08-10 14:08:16 +08:00
    @LU35

    上面已经说得够多了,再多说也是重复解释,没意思,你自便。
    LU35
        14
    LU35  
       2016-08-10 14:12:44 +08:00
    @ranran 哦哟,看了半天实在是反驳不了,就自便了.
    楼主问论坛实时更新到你这成 V2EX 了,你这为了符合自己的回答连楼主的需求都帮他改了.屌
    PubSubHubbub 扩展到你这里变成了只要阅读器支持不用管订阅源是否支持,把 RSS 的协议都改掉了.也是屌.
    ranran
        15
    ranran  
       2016-08-10 15:26:36 +08:00
    @LU35 相关原理和方式已经说明了。再说也是重复解释,没意思,还不理解就再看一次, Blocked
    LU35
        16
    LU35  
       2016-08-10 15:40:44 +08:00
    @ranran 你所解释的不过是找了 feedburner.com 来抓取 V2EX 的 feed,再通过 feedburner 所支持的 PubSubHubbub 来推送到阅读器.feedburner 的 5 分钟的频率就是实时了?
    其实我最不理解的是为什么楼主问的论坛你却强行改成了 V2EX?
    LU35
        17
    LU35  
       2016-08-10 15:41:50 +08:00
    @ranran 反驳不了就 BLOCKED 的确是怂人的好办法.
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2907 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 08:55 · PVG 16:55 · LAX 00:55 · JFK 03:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.