长话短说,群里有人做词典,想爬某词典的数据 我就找了海词比较好欺负 链接如下:
观察了一下 同一个单词比如 dog 他提交的 t 也就是 token 是一样的 32 位
并不是网上说的生成的一次性 token 然后在提交的 param 里面也没有看见时间戳 这是一个好事
我去 cmd5 网上加密单词 得到的都没有这种格式的 token (后来发现还是我自己蠢) 网上说 OAuth2.0 什么的加密是 sha
不知道这里有人做过这个么 请教一下
1
Delbert 2016-07-27 18:16:06 +08:00 via Android
直接 get 请求 http://dict.cn/word 不行么?
|
2
broono 2016-07-27 18:26:48 +08:00
要求不太高的话 直接 get 迷你翻译 请求 http://dict.cn/mini.php?q=fuck
|
3
xqin 2016-07-27 18:31:42 +08:00
|
4
xqin 2016-07-27 18:36:40 +08:00 1
token 的生成规则为:
1. 请求`http://dict.cn/mini.php?q=fuck`, 从页面中匹配这个区域` <script>var dict_pagetoken="da4108a54d25f704943b4b1635e23d83";</script>` 得到 `dict_pagetoken` 的值. 2. 参数`t`的计算方法为: md5('fuck' + 'dictcn' + 'da4108a54d25f704943b4b1635e23d83') 3. 记得在发请求的时候,把 cookie 带上. |
5
SlipStupig 2016-07-27 21:11:01 +08:00
为什么这种东西都需要抓取,直接去下载一本词典去搜就可以了.......
|
6
slysly759 OP @Delbert 好久没看 V2EX 了 先感谢你的回答。因为最近在练手关于 token 令牌的 所以找了这个软柿子。 1.我更多的想更快速的获取结果 2.我不想解析网页 这样很慢
|
7
slysly759 OP @xqin 太感谢你了 想请教一下:
1.如何快速发现这种生成加密 token 的 js 文件 2.我当时也挨个看过 js 文件 感觉你给的那个 js 我跟看天书一样 为啥和教科书上标准的清晰的不一样呢 我学过一点 js 但是对我而言那个跟乱码没啥子区别嗷呜。 真的很感谢你,期待大神能够带我飞~ |
8
slysly759 OP @SlipStupig 搜字典还是蛮 LOW 的嘿嘿 无论如何,感谢你的回复
|