V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  coolloves  ›  全部回复第 38 页 / 共 41 页
回复总数  802
1 ... 30  31  32  33  34  35  36  37  38  39 ... 41  
2016-07-26 13:14:02 +08:00
回复了 allencode 创建的主题 Python 小弟开源了一个 Python 爬虫+App 的应用,欢迎围观一波。
mark!!!!!
2016-07-22 23:12:55 +08:00
回复了 harry890829 创建的主题 DevOps 日志统计
最简单的不就这样?
cat xx.log|awkl '{print $x}' 统计什么就改 x 为什么
2016-07-16 16:13:50 +08:00
回复了 tikazyq 创建的主题 Python 为爬虫构建代理池
我是这样做的,先找代理网站爬下代理,然后定义验证地址来验证是否有限,然后存取
在正式用的时候,遇到无效的就记录无效次数加 1 ,成功的也记录次数加 1 ,然后一段时间内根据成功失败记录来清理代理池,留下定义多少概率的代理,
2016-07-09 13:48:19 +08:00
回复了 nlimpid 创建的主题 Python 求助,为什么 Requests 不能获取到知乎的页面?
加个 headers 就可以了把
2016-07-07 13:12:02 +08:00
回复了 yangyaofei 创建的主题 程序员 上亿调数据检索,用什么可以提高效率
上 es 吧,以下是刚刚实测的,
111,130,586 hits 的数据,输入关键字也就几秒就检索完了.
三台 dell730 做成的集群
2016-06-23 17:55:29 +08:00
回复了 coolloves 创建的主题 问与答 请教一个 apache rewrite 规则.
一直用 nginx,有台老机器要跳转走,准备慢慢下了,发现真心不太会设置啊,请教请教,多谢大家
2016-06-23 17:54:53 +08:00
回复了 coolloves 创建的主题 问与答 请教一个 apache rewrite 规则.
请教下,^/$ 这个应该就是访问 www.a.com 这个根主页吧.
我发现就是这个规则不生效
请教下,如何设置当访问地址是 www.a.com/以外的都跳转走
2016-06-20 22:15:27 +08:00
回复了 chinajik 创建的主题 NGINX Nginx 配置的疑惑
我理解的是 /(.+)$=/$1,执行后,break 了,所以访问 google.com 就是正常的 google.com
如果注释了,就反代到 localhost 去了
2016-06-20 13:15:48 +08:00
回复了 wraith4 创建的主题 云计算 今天发现公司的阿里云服务被黑了,被安装了 yam 来挖矿
放出来参考下吧
2016-06-20 12:49:07 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
@zjb861107 我也是在网上随手复制了个例子,还没仔细看,是没闭合,不过不是这个问题,应该是我 yum 装了 python-lxml,又 pip install lxml 造成的,pip uninstall lxml 后可以了.
2016-06-20 12:42:43 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
我接触 python 时间不长,刚想卸载了重新弄,bs 是 setup.py 装的,不知道怎么卸载,看了下 pip install bs 有,pip install lxml 也有,就都 uninstall 了,结果,发现可以了.
我安装 bs 是下载了源码,python setup.py install 安装的,然后 yum install python-lxml,这样使用没问题

后来出问题后,我 pip uninstall bs ,pip uninstall lxml,
然后 pip install bs,成功,但是 pip install lxml 失败,此时,我发现可以正常工作了.


再次,请教下各位,这几种安装方式,有什么区别?
yum
pip
python setup.py install
2016-06-20 11:12:45 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
在线等.
2016-06-20 11:07:22 +08:00
回复了 coolloves 创建的主题 Python 求救 beautifulsoup 无法使用问题
@liangmishi 谢谢回复
>>> soup = BeautifulSoup(html,"lxml")
>>> print soup

>>>
2016-06-19 10:06:31 +08:00
回复了 xiahei 创建的主题 Python Python 百度贴吧 签到
马克下!!!!
2016-06-17 21:07:14 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
@Kisesy 是的,我那样返回的是 str,刚学 python,多谢指点.
2016-06-17 21:06:22 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
我那个 rewrite 返回的是 str,不是 dict,所以 proxies 传入的类型错误了,我刚看了下 p 的类型是 str,不是 dict,多谢各位.
2016-06-17 20:59:27 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
@Kisesy
我的代理抓下来是 ip:port 格式保存的
我那个注释就是把代理改成{'http':'http://116.226.98.54:8118'} 格式
2016-06-17 20:57:18 +08:00
回复了 coolloves 创建的主题 Python 请教一个 requests 使用代理的问题!
我传入的是 dict 啊,所以我才比较纳闷
[root@localhost sh]# python httpreq.py
{'http':'http://116.226.98.54:8118'} 这个是我打印出来的 proxy
True
'str' object has no attribute 'get'
None
2016-06-14 21:46:26 +08:00
回复了 hippoboy 创建的主题 Python 求推荐几个爬取 js 生成的动态网页的教程?PhantomJS?其他?
马克
马克下,感谢分享
1 ... 30  31  32  33  34  35  36  37  38  39 ... 41  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5920 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 02:29 · PVG 10:29 · LAX 18:29 · JFK 21:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.