众所周知,微信公众号比较封闭,爬取也有一定门槛,一些常用的订阅方案经常需要多安装一个 APP,对于 RSS 用户来说很不友好,加上如今订阅号的推送也是乱序时间轴的,作为在推荐算法的重重包围下做挣扎的一员,做了一个订阅提醒的服务,希望在此借助 Github 为同好提供有限的订阅服务。
目前比较简陋,只有标题、发布时间和链接,因为我出发点就仅仅是提醒😓,如果将来需要摘要、缩略图的朋友比较多会考虑加上。
如需新增公众号请提 pr,RSS 文件定时自动更新到 github/gitee 。
希望能帮到有需要的人。
github 地址: → 传送门
1
codeforyou 2020-09-19 19:41:18 +08:00
你是如何爬取到数据的?
|
2
0o0O0o0O0o OP |
3
chotow 2020-09-19 20:21:28 +08:00
GitHub 的默认分支虽然以后要改成 main,但这是一个配置项,你可以手动修改:
https://github.com/settings/repositories 改过后就不用担心未来会被「强制」修改。 |
4
0o0O0o0O0o OP |
5
zdb1115 2020-09-19 22:55:48 +08:00
谢谢 试用一下
|
6
pC0oc4EbCSsJUy4W 2020-09-19 23:01:55 +08:00
RSShub 支持吗?
|
7
0o0O0o0O0o OP |
8
0o0O0o0O0o OP @fatelight
#6 🤝我也是 RSSHub 用户 RSSHub 是一种 RSS 生成器,这个的实现逻辑不太方便基于 RSSHub 实现,相当于我已经生成好了订阅源文件,通过 github/gitee 来更新,没太搞懂 RSSHub 的介入点,或许等足够稳定之后可以自荐到 RSSHub 收录的路由页面~ |
9
x9sec 2020-09-19 23:38:25 +08:00
方便分享下爬取思路吗?企鹅:MTY0OTg4MDk4OA==
|
10
imdong 2020-09-19 23:48:04 +08:00
思路大概有两个,一个如一楼大神所说,逆向客户端,另一个思路是搜狗搜索吧。
另: crontab 0 0 0 * * send "楼主服务关闭了没?" |
11
BetterSci 2020-09-20 07:29:42 +08:00
想订阅的公众号:MeetChem
化学教育期刊 共享化学 |
12
BetterSci 2020-09-20 07:35:44 +08:00
bizid:MzIxOTI2MDQ5Mw==
|
13
iiusky 2020-09-20 09:38:20 +08:00 via Android
微信 rss 还是小众用户。。我是自己需要,所以搞了一个。v 站有一些小伙伴也用过。🌚
|
14
0o0O0o0O0o OP @BetterSci
#11 我用你的需求做了个图文教程来示范如何添加公众号(截图截到手酸😓),你可以看一下(例如 Better 化学大本营 已经同步了一次了可以订阅了) 都是在网页上操作,你可以自己尝试着添加 化学教育期刊 或者其他公众号🤝 |
15
scottyeung 2020-09-20 13:19:43 +08:00
好活!之前我也有这样的想法,但是数据来源不好弄就放弃了
star 一个字词一下 |
16
nnxs 2020-09-20 22:44:02 +08:00
简直太棒了, 配合 Reeder 的 Reader view 太完美了!
|
17
0o0O0o0O0o OP 在搜索引擎收集了一些公开的榜单,目前已收录近 700 个公 x 号,目前服务正常
|
18
0o0O0o0O0o OP 当前已收录近 1500 个公 x 号,目前服务正常
|
19
BetterSci 2020-09-24 08:12:43 +08:00
@0o0O0o0O0o Thanks for great work and sharing...
|
20
BetterSci 2020-09-24 19:38:06 +08:00
@0o0O0o0O0o 抱歉,我还没有学会怎么添加
|
21
BetterSci 2020-09-24 19:55:29 +08:00
利用搜索引擎,搞明白了怎么 pr 了,再次感谢
|
22
0o0O0o0O0o OP |
23
BetterSci 2020-09-25 09:15:06 +08:00
谢谢你热情而洋溢的指导,昨天重新尝试了 pr 提交了 化学教育 的 bizid
|
24
0o0O0o0O0o OP |
25
BetterSci 2020-09-25 19:17:50 +08:00
@0o0O0o0O0o 我再学习下
|
26
0o0O0o0O0o OP 稳定运行...啊不是稳定抄录一周😂
|
27
linxl 2020-09-29 09:43:37 +08:00
biz 的话是通过公众号后台得插入文章链接爬的 (这个途径有频率限制, 一天查不了几次)?
|
28
0o0O0o0O0o OP |
29
MrMario 2020-09-29 10:04:11 +08:00
有一个小问题反馈一下,目前基于托管站点的 raw 查阅,响应是文件下载,没有正确适配 MIME type,部分 rss 上无法正常添加
|
30
0o0O0o0O0o OP @MrMario
#29 这个我也没有什么好办法。。。因为本身就是希望借助 github/gitee 来控制成本(查阅了条款不算滥用)😂 像 reeder 、feed reader 之类的工具是可以添加成功,不支持的目前可能需要自己处理一下了,例如借助 cloudflare workers,免费的每天十万条请求的额度,自用肯定够了 |
31
saimax 2020-10-01 22:28:51 +08:00
支持~ 非常好~ 已经把目前大多数的 bizid 拼上具体的 url 链接自用方便搜索导入了~
|
32
0o0O0o0O0o OP |
33
treblex 2020-10-02 02:19:13 +08:00 1
@0o0O0o0O0o #32 https://github.com/Treblex/wechat-feeds-page 深夜摸鱼,做了个简单的页面
|
34
0o0O0o0O0o OP |
35
0o0O0o0O0o OP |
37
BetterSci 2020-10-05 16:52:22 +08:00
@0o0O0o0O0o 感谢你热情且及时的帮助
|
38
ashine 2020-10-05 22:28:51 +08:00
微信公众号头像要如何获取呢?
> list.csv 里面没有 |
39
0o0O0o0O0o OP |
40
saimax 2020-10-08 16:17:33 +08:00
@suke971219 实在是太 6 了
|
41
0o0O0o0O0o OP 稳定抄录一个月~当前 1600 余个
|
42
0o0O0o0O0o OP 今天服务器出了点问题,故障了十几个小时,已恢复
|
43
Anna1879 2020-11-11 02:31:31 +08:00
已 star,太感谢了
|
44
wangtiezhu 2020-11-16 16:23:59 +08:00
老哥,后期会考虑弄公众号图标吗,目前正在安卓端测试哪些软件可以用,有的还得 fanqiang 才能看到
|
45
0o0O0o0O0o OP |
46
0o0O0o0O0o OP 稳定抄录两个月~当前 2000 余个
|
47
0o0O0o0O0o OP |
48
0o0O0o0O0o OP |
49
mywaiting 2020-12-13 22:08:08 +08:00
mark 备用~~~
最近需要跟踪 N 多的公众号更新,mark 一个,万一贴主会私信我如何实现抓数据的方法呢[~醒醒~] |
50
0o0O0o0O0o OP |
51
mywaiting 2020-12-13 23:05:50 +08:00
@0o0O0o0O0o #50 几番折腾,大概知道你是怎么拿到如此巨量公众号更新的,我还有点工程化的小问题解决
还是挺感谢你提供这么一种可能性,不然看看就觉得没啥希望的事情了~~~ BTW 友情暗示,这货有商用的可能的,可以考虑一下商用的可能,现成的例子就是 werss |
52
0o0O0o0O0o OP |
53
0o0O0o0O0o OP |
54
mywaiting 2020-12-13 23:35:42 +08:00
@0o0O0o0O0o #53 这样的服务开源是不可能的,毕竟见光即刻 die
违法这事情还是有多种方法规避吧,有很多思路能合理合法(也不是那么合法不过不会惹事上身就是了)地搬运这些内容的 还是感谢贴主的免费服务,多谢!!! |
55
0o0O0o0O0o OP 服务器宕了十几个小时,已修复
|
56
0o0O0o0O0o OP gitee 同步最近出了点问题,暂时已修复
|
57
0o0O0o0O0o OP 试着用奇怪的办法处理了下图标,各位平时用阅读器的可以帮忙测试下,有别的好思路可以共同讨论,参见 issue #895
|
58
0o0O0o0O0o OP |
59
Notzuonotdied 2021-01-31 15:41:47 +08:00
你这个太 nice 了吧
|
60
yhkang 2021-02-02 11:19:14 +08:00
很不错
|
61
0o0O0o0O0o OP 为什么昨天突然新增了好多 star,发生了什么(°ー°〃)
|
62
saimax 2021-03-16 10:13:06 +08:00
用了好几个月了,来顶一下。一边见人就宣传,一边又怕知道的人多了会有停止服务的那天,纠结
|
63
0o0O0o0O0o OP @saimax #62
感谢感谢。 由于托管在 github 上,所以最大头的服务器费用反而省了,所以成本上还好;至于法律风险嘛,是由不知疲倦的我手动抄录的,也不牟利,腾讯应该也没法这么霸道 唯一可能造成停止服务的情况是腾讯加大了抄录的难度,这个和使用的人数关系不大,只能说是腾讯生态的趋势,总有那么一天的 |
64
0o0O0o0O0o OP 今天总算超过 5000 个了
|
65
hdjs5264 2021-05-01 14:32:28 +08:00
哇,好人,感谢
|
66
0o0O0o0O0o OP 犹豫了大半年,今天因为 #2408 终究还是决定放弃全文 RSS 的计划,使用本项目如果有全文需求还是请各位借助阅读器吧
|
67
0o0O0o0O0o OP 由于一些原因,移除了 gitee 的同步,将只更新 github,说声抱歉
|
68
saimax 2021-05-11 08:50:59 +08:00
@0o0O0o0O0o 安全第一~
|
69
0o0O0o0O0o OP 服务器挂了,联系客服中
|
70
0o0O0o0O0o OP @0o0O0o0O0o #69 已恢复
|
71
0o0O0o0O0o OP 6000 个了
|
72
0o0O0o0O0o OP 昨天和今天被刷屏新增了一千多个荐股公众号,虽然有点恶意揣测,但感觉是拿本项目当爬虫用而不是 RSS 。
目前总共七千多个了,离一万个的限额不远了。 |
73
fghshunzi 2021-06-09 16:59:41 +08:00
@0o0O0o0O0o 帅哥 10000 个很快被占掉了 下面会新增吗
|
74
0o0O0o0O0o OP @fghshunzi #73 见 issue 讨论,我先将上限调节到了 20000,但之后的具体措施仍待讨论
|
75
fghshunzi 2021-06-22 21:24:52 +08:00
@0o0O0o0O0o 凉凉了吗?
|
76
0o0O0o0O0o OP @fghshunzi 很有可能
|
77
fghshunzi 2021-06-22 22:30:50 +08:00
@0o0O0o0O0o 是被微信封杀了?
|
78
crisrock 2021-06-23 10:47:43 +08:00
@0o0O0o0O0o 是被微信封了?
|
79
caryRowen 2021-06-30 13:09:35 +08:00
@codeforyou 可惜了。
|
80
hvboekml 2021-08-21 14:51:40 +08:00
|