V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  est  ›  全部回复第 344 页 / 共 614 页
回复总数  12276
1 ... 340  341  342  343  344  345  346  347  348  349 ... 614  
@wind4 忘记说关键步骤了。
@PublicID 以前只是登陆有加密。现在是浏览邮件也加密了。
2015-11-05 12:31:16 +08:00
回复了 foru17 创建的主题 硬件 占美迷你主机体验
mac mini 服役中。
2015-11-05 09:25:10 +08:00
回复了 c742435 创建的主题 Google Google 搜中文页面就 TM 是一坨屎
所以建议搜索关键字为 :“ ajax onunload 事件” 或者“ ajax onunload 调用” 保证结果都是中文的。
2015-11-05 09:24:09 +08:00
回复了 c742435 创建的主题 Google Google 搜中文页面就 TM 是一坨屎
1. google 搜索近几年都有点屎。最近 +"keyword" 有的时候都能忽略
2. 你输入全英文关键字,要求找中文网页,这个对机器来说是个巨大挑战。机器如何判断页面是中文的还是英文的?还是中英混合的?这些都没法严格定义。在机器看来,每个字符都是 unicode 。。。。
2015-11-04 12:48:40 +08:00
回复了 yvanhe 创建的主题 分享发现 每年 10 月底到 11 月底都不能愉快地网购了
实体店不大肆开展:“双 11 付款即提货, 0 秒发货” 活动也是笨。
2015-11-04 11:52:12 +08:00
回复了 est 创建的主题 分享发现 iphone6 手机 16GB 改 128GB 版本
@a6377508 这个吊。
2015-11-03 17:13:46 +08:00
回复了 juneszh 创建的主题 Android 支付宝被 google play 下架了?
@mailworks 这个是违反苹果 ToS 的。可以举报。 ios app 只能使用 appstore 自带的升级机制。严禁其他途径。
2015-11-03 16:35:54 +08:00
回复了 solaro 创建的主题 MySQL 为什么辣么多人喜欢用 tinyint 而不用 enum?
unsigned 不算强迫症,可以考虑改过来。

enum 移植性不如 tinyint 。
2015-11-03 16:23:33 +08:00
回复了 youkangda 创建的主题 Python 高薪诚聘 Python
其实看到 3 楼的回复,想吐槽,突然又懒得吐槽了。就直接拉黑了。小伙伴们把我想说的都说了。
75 TB per user or 14,000 times the average 。。微软真是没见过世面。
2015-11-03 14:44:16 +08:00
回复了 youkangda 创建的主题 Python 高薪诚聘 Python
既然是高薪,又是诚聘 ,还发到 /go/python 这个技术讨论区,那么明说工资范围吧。

btw 地点也没有。
2015-11-03 13:33:17 +08:00
回复了 easyhappy 创建的主题 Python COCA20000 爬单词
好像别人是免费提供的 。。。 http://corpus.byu.edu/full-text/database.asp
2015-11-02 22:16:44 +08:00
回复了 est 创建的主题 Python 这么多搞爬虫的,有木有直接解析 HTML 的呀?
@binux 求分块树相关 case 。

还有就是你们是怎么保存富文本数据的?直接 html 还是?
2015-11-02 21:57:31 +08:00
回复了 est 创建的主题 Python 这么多搞爬虫的,有木有直接解析 HTML 的呀?
@menc wikipedia 的页面特定模板解析起来很有意思的。比如可以绘制出地球上人口超过 20w 的城市分布图。但是我感觉这个属于另外一个话题了。
@Sivan 国产的。就当 299 的普通电饭煲用。
@harry890829
@wkdhf233

问了下,买的那家,咬着不放。。因为都好评了。

便宜的那家,说是做活动。名额有限。

包装都拆了。。。。
2015-11-02 20:59:24 +08:00
回复了 est 创建的主题 Python 这么多搞爬虫的,有木有直接解析 HTML 的呀?
@hooopo 我还以为去了隔壁 rubychina 。。。哈哈。用 ES 的确可以做到。赞。
KV 数据库很少有支持 array 的。 redis 是异端。别人号称 data structure server
2015-11-02 16:40:12 +08:00
回复了 est 创建的主题 Python 这么多搞爬虫的,有木有直接解析 HTML 的呀?
@chairuosen 不是通用不通用的问题,而是爬出不仅要保留文字本身的信息量,还要保留当时标题,段落。排版,展现格式,甚至页面环境等信息量。

虽然我估计 99% 的页面,都是一种字号不分大小写不分段落标题格式通吃,但是总有那么一些出彩的页面,很注重行文的附加信息。
1 ... 340  341  342  343  344  345  346  347  348  349 ... 614  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2327 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 78ms · UTC 15:34 · PVG 23:34 · LAX 08:34 · JFK 11:34
Developed with CodeLauncher
♥ Do have faith in what you're doing.