V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  changwei  ›  全部回复第 80 页 / 共 88 页
回复总数  1758
1 ... 72  73  74  75  76  77  78  79  80  81 ... 88  
2016-11-30 15:35:26 +08:00
回复了 gouchaoer 创建的主题 PHP php 的爬虫经验分享
对了,还有就是我现在写的爬虫大多数都是这种需求,就是有一个获取 list 的接口(文章列表),先去这个接口获取一批 id ,再去一个通过 id 获取详情的接口(文章内容)来获取具体要抓取的数据。

我现在在 python 下是用 threading 和 queue 队列来实现的抓取,请问 php 下是如何做类似需求呢?
2016-11-30 15:33:18 +08:00
回复了 gouchaoer 创建的主题 PHP php 的爬虫经验分享
楼主你好,看了你的文章收获很多,请问能否分享一下你的 github ?

我也是 phper ,但是由于我开始也和你说的很多人一样以为 php 的多线程能力很弱,虽然知道 php 用 pthreads 扩展可以实现多线程,但是编译和安装扩展的时候出现了各种坑,因此只好转 python 了。

关于 php 的 nts 和 zts 我有一个疑问,就是你说的 nts 是为了兼容 iis 下的 ISAPI ,那么请问为什么 linux 下的 php 版本也区分 nts 和 zts 呢?还有就是我看 python 和 java 里面仅仅是在模块级别上区分是否为线程安全版本(比如说 py 的 queue 队列这种数据结构就是线程安全版本,还有 java 下的 Vector 和 arraylist ),为什么 php 是整个版本就开始做区分呢?

还有关于全局锁的问题,我发现我 python 写的爬虫如果开 10 个线程,那么命令行输出就是一次性输出 10 条抓取日志然后突然停顿 0.5s 左右,请问这 0.5s 是不是就是你说的由于全局锁的关系,导致它内部在做线程调度从而产生这 0.5s 的卡顿时间?

谢谢楼主的分享。
@AbrahamGreyson 在 ar 中使用对象去表示查询条件这个具体指的是什么呢? Laravel 的 ORM 难道不是这样吗?

@huijiewei 不用 gii 和 activeForm 的话,这个框架还有什么比其他框架更有特色的地方呢?
@giuem 这个居然还活着,话说谷歌在中国除了广告,翻译,地图以外还有哪些没被封的啊?
2016-11-28 14:17:34 +08:00
回复了 neoblackcap 创建的主题 程序员 前端工程师应该掌握算法吗?
你可以让他们直接展示自己做过的项目,看看他们源代码的代码规范性怎么样,因为国内像谭浩强这种教程深入人心,很多人都习惯了他那种 abcd 的变量命名和不规范的缩进,你光看算法根本看不出他的代码质量和对于大项目,逻辑复杂的 SPA 等等的编码能力。
2016-11-28 14:15:14 +08:00
回复了 livedutvchina 创建的主题 编程 15 岁的比利时少年使用 Laravel 开发儿童教育网站
确实很厉害,但是那个网站我移动宽带访问太卡了,简单的看了看前面几十分钟他好像一直在展示视图层代码,控制器我怎么没看到他在写呢。后面看不了了,太卡了。。。
2016-11-28 13:51:18 +08:00
回复了 Jack 创建的主题 程序员 网站统计到带外站 URL 的奇怪的流量
@xzem 居然还有这种刷流量方式,我也是学习了!!!
2016-11-28 13:50:19 +08:00
回复了 j717273419 创建的主题 程序员 我想用国内的一台服务器代理上网,怎样配置?
我用的是腾讯云,百度搜索 linux 搭建 ss 服务器教程,照着这样做的,现在一直运行正常。百度 ip 显示的是广东腾讯总部
2016-11-26 00:28:10 +08:00
回复了 kiwiz 创建的主题 问与答 你读过的翻译最差的计算机著作是哪本书?
sql 注入攻击与防御(第二版),这本书我严重怀疑是用谷歌机器翻译加极少数的人工翻译,整篇书凡是涉及到从句部分,都没有把语序调整为国语的语序习惯,这是典型的机翻结果。。。
2016-11-26 00:19:14 +08:00
回复了 JohnH 创建的主题 PHP 你为什么/因为哪些方面不喜欢 ThinkPHP 框架?
@kancloud 好吧我承认我的确没有为 tp 贡献什么,也承认 tp 在后来几个小版本的发布中多出了很多优雅特性。

至于你说的我没有建议我就有点不高兴了,我记得每一次你在 v2 发布新版本的 tp 我都有过大量回复建议,不信你可以去找找。

还有你说的贡献,我想说一段往事,记得 tp 还在 rc 版本的时候,当时加了一个群,提了一个小问题(查了手册解决不了,没查源码),群里面有个管理员当时对我说了一句,滚去看手册,我说就是因为手册没有,论坛发帖没人回复我才来群里面问的啊,然后又有个管理员说你问完了吗?问完了你就可以走了,然后我就被 t 了。在我被 t 之前我也无数次看到管理员和群里面的一些人不停的争吵,甚至还有人在论坛说 tp 手册收费,结果一群人各种贴吧式的花样嘲讽,穷鬼玩什么框架之类的言论。

我不知道是不是国外的开源社区也都戾气那么重,反正 tp 给我的印象就是,劳资花了十年开发的框架,我无私开源,慷慨奉献,你们爱用不用不用别 bb 。

大家能在这里吐槽,说明用过的人和关注的人很多,希望你们能整顿好社区,营造粉丝效应,不要求你做出情怀,至少别伤了我们这些普通用户的心。
2016-11-25 21:10:38 +08:00
回复了 changwei 创建的主题 问与答 捞月狗和 max+等游戏数据分析平台是怎么抓取的数据?
@ylsc633 我看了,就四条回答记录,没说过啊
2016-11-25 18:35:17 +08:00
回复了 yigeshitou 创建的主题 分享创造 脑洞大开的故事创作社区
@yigeshitou 对了手机上有款 app 叫做看山,貌似和你的思路创意很相似,你可以去参考参考
2016-11-25 18:32:46 +08:00
回复了 JohnH 创建的主题 PHP 你为什么/因为哪些方面不喜欢 ThinkPHP 框架?
我之前也很喜欢 Thinkphp ,尤其是出了 5.0 之后觉得会有很大起色,但是看了一些人写的代码,后来我想错了。

Thinkphp3.2 已经有 @m939594960 吐槽过了,我就谈谈其他的吧。

首先 Thinkphp5.0 号称模型层有巨大改进,然而我发现连用 model 工厂函数生成 common 公共模型都是错的。我去提 issus 被其他用户告知要手动按命名空间生成。

其次这个模型层的官方文档非常简单,很多用法连例子都没有,如果不用 ide 的话都不知道某些方法的参数是什么。总之用 Thinkphp 的话不是很熟练的情况下不能用编辑器,否则等着踩坑吧。不仅仅是模型层,其他文档也一样,文档还是太简单了,可能是刚发布不久还在修订中。

接着就是缓存了, Laravel 中缓存有个 remember ,可以以很优雅的方式写缓存的存储+获取,而 Thinkphp 中我得先判断缓存是否有,有的话直接 get ,没有的话得先 set 然后输出,写法非常不优雅。不仅仅是缓存,其他相关的服务也一样不优雅。

然后还有他的源码,看 5.0 的源码看到第一个加载的核心类 Loader.php 我就看不下去了,整个类文件里面所有的方法连 docblock 注释都是有的有有的没有, private 方法和 public 方法混合摆放,让我们阅读代码的时候无法以一种自顶向下的方式轻松的阅读,给人的感觉就像是这个代码是由几十个人没有用版本控制系统写出来一样。私有成员也没有用_下划线标明,代码毫无规范性。某些类库头部连作者,包名,修改时间都没有(难道开源项目就没有责任到人的说法嘛?)。可能我说的现象现在有些代码改了,但是确实是有这种情况的。

最后也是我最想表达的一点: Thinkphp 框架即使本身已经很优秀了,但是由于它简单上手,导致使用它的人群平均水平比较低,写出来的代码质量非常差,体现到实际项目中很多人就认为这是框架的锅。相反用 Laravel 的人由于本身更具有好学,主动进取,对英文掌握良好(这点非常重要,英文好的人,他们变量名,标识符都写的非常规范),所以导致我们看起来 Laravel 写的项目整体都非常漂亮优雅。
2016-11-14 10:58:10 +08:00
回复了 kancloud 创建的主题 PHP ThinkPHP V5.0.3 版本发布——双十一祝 PHPer 早日脱单
哈哈, Thinkphp 每次发布新版本都是在一个特殊的节日,上次是中秋节,在上次忘了。。。

但是还是有不好的话要说,就是 Thinkphp 的 Loader.php 加载器的源码不知道是很多人一起写的还是网上 copy 了几段别的框架的源码?注释和标识符非常不规范,而且 private 方法 product 方法和 public 方法没有归类摆放,而是混插,如果作为很多初学者第一次用的框架,阅读源码的时候会带来很多不便。希望这些官方都能改进一下。

另外就是一些 vendor 组件的用法文档里面能不能再详细一点,很多地方连示例源代码都不是完整的,让初学者摸不着头脑,我都是看源码才知道怎么用,但是不是所有人都会花时间去看源码。

最后我发现了一个不知道算不算 bug 的地方,就是 model 助手函数无法实例化 common 公共模型,具体问题看这里 https://segmentfault.com/q/1010000007445338

还是很看好这个框架,谢谢开发者,支持中。
2016-11-14 01:20:56 +08:00
回复了 Coande 创建的主题 程序员 天猫用的是什么服务器?
天猫 web 层不是用的 node.js 吗?怎么会有 tomcat 呢?
2016-11-14 01:05:23 +08:00
回复了 icedx 创建的主题 天黑以后 20161114 午夜俱乐部
来打王者荣耀吧(°ー°〃)
2016-11-13 18:15:27 +08:00
回复了 ariesray 创建的主题 问与答 建行钓鱼网站,还是 95533 号码发送的
@R18 这是什么?
1 ... 72  73  74  75  76  77  78  79  80  81 ... 88  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1006 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 20:01 · PVG 04:01 · LAX 12:01 · JFK 15:01
Developed with CodeLauncher
♥ Do have faith in what you're doing.