V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Daniel65536  ›  全部回复第 15 页 / 共 32 页
回复总数  626
1 ... 11  12  13  14  15  16  17  18  19  20 ... 32  
安装nodejs,然后nodejs xxx.js
2015-04-18 12:32:56 +08:00
回复了 won 创建的主题 Ingress 帝都有多少人玩 ingress?
@won 204681153
2015-04-18 00:19:22 +08:00
回复了 yaoppp 创建的主题 问与答 这个下载地址有什么规律?
@lsdnes 你不直接@我,我是看不到提醒的。

直接在terminal运行就好。
你是不是用了无痕浏览……
2015-04-16 15:59:04 +08:00
回复了 Registering 创建的主题 Python 准备练手写一个爬虫,问问老司机
经验:写爬虫前一定要多花时间分析目标网站,分析用多一分钟顶你爬多一天。

你这个具体问题上爬虫爬一个月还不如我直接读取网页花一秒。

经验2:多花时间分析流量有效性比。

为什么要去读取html?如果有RESTful api读json的效率是不是高更多?
充满层级/样式/脚本的html中有价值的数据的比例占总数据量的多少?有没有20%?
json有效数据比例可以高达70%,同样网速爬取速度就能快3-5倍,还不用考虑html的解析问题。

#一点爬数据的人生经验
2015-04-16 15:50:45 +08:00
回复了 Registering 创建的主题 Python 准备练手写一个爬虫,问问老司机
思路偏了。

直接读取这个网页就行了:
http://www.zhihu.com/topic/19776749/top-answers

1.知乎-话题-精华 会按照投票数量排序某话题/子话题下的最高票答案
2.知乎-根话题 是所有话题的母话题

所以直接检查根话题精华就能得到票数最高的答案了。
Mac下的首选当然是rime。
2015-04-14 14:01:29 +08:00
回复了 yaoppp 创建的主题 问与答 这个下载地址有什么规律?
@surftheair
我这里cat_list有返回啊:
$ curl "http://ezfm.china-plus.net/index.php?m=index&a=cat_list&cid=224"
{"data":[{"id":"430","cid":"224","title":"\u98de\u9c7c\u79c0-\u7535\u5f71\u50ac\u6cea","compere":"","lpic":"http:\/\/123.56.91.34\/Uploads\/image\/20150414\/20150414115237_34310.jpg","url":"http:\/\/123.56.91.34\/Uploads\/media\/20150414\/20150414115215_89404.mp3","duration":"","brief":"","m_share":"0","pub_share":"","open_status":"1","hits":"95","b_hits":"322","c_hits":"6","d_hits":"132","update_time":"2015-04-14","f_time":"14\u5c0f\u65f6\u524d","size":"126.18"},{"id":"419","cid":"224","title":"\u98de\u9c7c\
2015-04-14 13:59:31 +08:00
回复了 yaoppp 创建的主题 问与答 这个下载地址有什么规律?
看,参数表都有了,随便一条命令就能完成全部工作:

$ curl "http://ezfm.china-plus.net/index.php?m=index&a=cat_list&cid=224" -s | jq '.data[]|.title,.url' -r
飞鱼秀-电影催泪
http://123.56.91.34/Uploads/media/20150414/20150414115215_89404.mp3
飞鱼秀-如释重负
http://123.56.91.34/Uploads/media/20150413/20150413140314_46952.mp3
飞鱼秀-桌面背景
http://123.56.91.34/Uploads/media/20150410/20150410134301_66025.mp3
飞鱼秀-等我老了
http://123.56.91.34/Uploads/media/20150409/20150409114612_70668.mp3
飞鱼秀-初恋这件小事
http://123.56.91.34/Uploads/media/20150408/20150408133335_71534.mp3
飞鱼秀-垃圾食品
http://123.56.91.34/Uploads/media/20150407/20150407125619_19902.mp3
飞鱼秀-中国特色
……


甚至直接生成podcast feed:
$ curl "http://ezfm.china-plus.net/index.php?m=index&a=cat_list&cid=224" -s | jq '.data[]|"<item>\n<title>\(.title)</title>\n<link>\(.url)</link>\n<guid>\(.url)</guid></item>"' -r
<item>
<title>飞鱼秀-电影催泪</title>
<link>http://123.56.91.34/Uploads/media/20150414/20150414115215_89404.mp3</link>
<guid>http://123.56.91.34/Uploads/media/20150414/20150414115215_89404.mp3</guid></item>
<item>
<title>飞鱼秀-如释重负</title>
<link>http://123.56.91.34/Uploads/media/20150413/20150413140314_46952.mp3</link>
<guid>http://123.56.91.34/Uploads/media/20150413/20150413140314_46952.mp3</guid></item>
<item>
……

想干啥干啥。
2015-04-14 13:31:52 +08:00
回复了 yaoppp 创建的主题 问与答 这个下载地址有什么规律?
@surftheair cid随便举个栗子而已嘛……API参数都给列出来了剩下还有啥麻烦的,随便写就是嘛。
2015-04-14 02:24:57 +08:00
回复了 yaoppp 创建的主题 问与答 这个下载地址有什么规律?
既然你都抓包了,为啥没找到那个返回音频文件地址的API呢?

好吧,我直接告诉你它们所有的API,你直接打开这个网页: http://123.56.91.34

上面把API的使用方式都列出来了。

#我果然是找API大师

比如:
[视听列表接口] -----------------------------------------------------------------
接口地址: http://ezfm.china-plus.net/index.php?m=index&a=cat_list&cid=134
传输方式:POST
param:
cid: 栏目id
return:
data
id: id值(唯一的)
cid:所属栏目id
title:名称
compere:主持人
lpic:图片
url:链接地址
duration:时长
brief:简介
m_share:分享量
open_status:打开方式
hits:点击量
b_hits:浏览量
c_hits:评论量
d_hits:下载量
update_time:更新日期
f_time:时间描述
size:文件大小
2015-04-13 20:41:06 +08:00
回复了 imeoer 创建的主题 分享创造 纸小墨:简洁的中文博客构建工具 (http://www.inkpaper.io/)
跑个小题,logo里用羽毛笔是不是不太恰当呢?毛笔才比较符合吧……
2015-04-13 00:05:14 +08:00
回复了 cxshun 创建的主题 macOS 升级 10.10.3 后开机慢了
@cxshun 苹果一直是按照一个版本加功能一个版本修性能这么一个套路来的,你现在看到的Yosemite差不多相当于vista。

如果你只看xp到vista,那么微软也是系统越做越占用资源啊。
air13寸的性价比相当高啊,唯一缺陷就是屏幕了。
2015-04-12 20:11:21 +08:00
回复了 cxshun 创建的主题 macOS 升级 10.10.3 后开机慢了
vista被你吃了?

Tick-Tock这个词你听说过么?

开机慢自己清nvram。
2015-04-12 15:57:24 +08:00
回复了 tanteng 创建的主题 macOS 如何在 Mac 下快速的执行某个路径下的文件
右键 创建替身

这就是Mac下的快捷方式
2015-04-12 00:50:01 +08:00
回复了 b244183 创建的主题 macOS OS X 下如何加密单个文件夹 or 文件
磁盘工具 新建 加密虚拟卷
相当于新建了一个加密的磁盘镜像文件,输入密码挂载之后随意读写,简单方便。
2015-04-10 21:33:54 +08:00
回复了 won 创建的主题 Ingress 帝都有多少人玩 ingress?
帝都蓝军?加了北京蓝军群了么?
1 ... 11  12  13  14  15  16  17  18  19  20 ... 32  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3574 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 10:23 · PVG 18:23 · LAX 02:23 · JFK 05:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.