各位V友有尝试过去抓斗鱼的弹幕么。。
斗鱼的似乎不像B站那样把弹幕放在一个xml上比较好抓
那个chatRoom.js我也看不出什么名堂
console里滚着类似 try { flashtoXML(console.log("弹幕……保活消息 时间戳=2301417 time =00:12:30.083")) ; } catch (e) { "<undefined/>"; }
的信息。但是我不知道flashtoXML是从哪来的。。
抓这种实时的弹幕有什么好方法么。。
1
m939594960 2015-05-16 21:04:37 +08:00 via Android
试过貌似flash调用的js
|
2
yangff 2015-05-16 21:05:32 +08:00
从swf来的.
|
4
evlos 2015-05-16 21:52:51 +08:00 via iPhone
解析 SWF 吧
|
5
laoyuan 2015-05-16 21:55:55 +08:00
666666666
|
6
iloveayu 2015-05-16 22:47:38 +08:00
用selenium搞,简单粗暴,虽然是种非常low的方式。
|
7
bengol 2015-05-16 22:49:27 +08:00
请教下,弹幕抓取下来的数据主要可以做什么呢?
|
8
yielder OP @bengol 那些6666应该没什么用。。我看到某主播在roll东西,水友基本上发的都是手机号,我想要能把这么多手机号抓下来应该有用,就是这样。。主要还是闲着无聊。。。
抓这个涉及到什么swf解析什么的,感觉有点复杂了。。 |
9
ETiV 2015-05-16 23:12:32 +08:00 via iPhone 1
用Wireshark抓包,看他的tcp包吧……
我用nodejs做的,tcp连接上之后做on data的监听即可。还需要定时发心跳包,没记错的话,flash里应该是45秒。 斗鱼的弹幕文本协议需要解析一下,不是xml或者json。我当初是看着flash的字节码实现的解析方法… |
10
loveuqian 2015-05-16 23:13:39 +08:00 via iPhone
斗鱼不是有个弹幕助手么?要不在那试试?
|
11
loveyu 2015-05-16 23:21:42 +08:00 1
如果你可以自己写个TCP连接到斗鱼的服务器。然后你就可以获取到弹幕还有消息通知之类的,前提是有一个登陆操作,自己抓包分析应该不难,返回的数据是一个我看着很不爽的的编码方式,各种@在中间。
|