V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  lakewalker  ›  全部回复第 1 页 / 共 1 页
回复总数  3
@maomaomao001 git 上有最原始的版本
2015-08-05 09:14:14 +08:00
回复了 xiaobetty 创建的主题 推广 晒出你最蠢的一段代码,送 Cherry 鼠标垫
大一时刚学c语言,刚上完课,睡得迷迷糊糊,连循环是啥都没搞明白,老师就是当场完成99乘法表,否则不许下课,情急之下,只能写
#include "stdio.h"

int main() {
printf("1*1=1");
printf("1*2=2 2*2=4");
printf("1*3=3 2*3=6 3*3=9");
...
return 0;
}

写完才发现只有北京的程序猿才能拿...上海的飘过
2015-07-29 15:58:33 +08:00
回复了 Mirachael 创建的主题 Python 请教一个 python scrapy xpath 的问题。
页码都是page.js生成的。

有个办法,你可以先从response中把var countPage = 25这一句话用正则给匹配出来,取25这个数字,然后下一页你就直接去拼url,都是有规律的
第二页: http://www.csrc.gov.cn/pub/newsite/xxpl/yxpl/index_1.html
第三页: http://www.csrc.gov.cn/pub/newsite/xxpl/yxpl/index_2.html
...

以最大page count,搞个循环然后直接用拼出来的url进行yield_request操作,就可以不用phantomjs来抓了,phantom比较慢,不过对于只有25页来,还好。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1182 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 18:25 · PVG 02:25 · LAX 10:25 · JFK 13:25
Developed with CodeLauncher
♥ Do have faith in what you're doing.