1
codeninja 2015-05-29 16:14:28 +08:00
乌云老大比较熟偶尔帮忙检查一下漏洞
这就满牛逼的了感觉 |
2
publicID001 2015-05-29 16:17:09 +08:00
唉 提交洞总是被miss
|
3
welsmann 2015-05-29 16:20:15 +08:00
乌云老大....剑心?
|
4
johnsmith123 2015-05-29 16:21:11 +08:00
再好的系统 也难防内鬼
|
5
lhy360121 2015-05-29 16:31:15 +08:00
服务器超过千台以后,你会发现你进入了另一个世界。
|
8
phoenixlzx 2015-05-29 18:08:17 +08:00
@AntiGameZ ansible/puppet 是干啥吃的啊(
|
9
RIcter 2015-05-29 18:20:14 +08:00
专职运维倒是都有,但是很多公司没有专职的安全工程师是真的。
_(:3」∠)_ 等公司大了一般才会去找安全工程师吧。 像某钩现在还小,不知道找个安全工程师,被爆菊了都不知道呢还。 |
10
erevus 2015-05-29 18:30:01 +08:00
专职运维倒是都有,但是很多公司没有专职的安全工程师是真的。
_(:3」∠)_ 等公司大了一般才会去找安全工程师吧。 像某ABAB现在还小,不知道找个安全工程师,被爆菊了都不知道呢还。 |
11
wy315700 2015-05-29 18:31:43 +08:00
看了读研的时候选择安全专业是选对了。。。
当初好多人安利我,说安全没啥用,不会有人关心的。 |
12
9hills 2015-05-29 18:44:21 +08:00
@phoenixlzx 然后puppet配错,所有机器都挂了。laf
|
15
mywaiting 2015-05-29 20:16:13 +08:00
有大量机器的时候,应该分为好批次的机器吧,代码版本按feature打flag,每次上线按flag部署,几个批次的机器迭代着部署,从几台、几十台、几百台最后全部机器部署,线上按flag分小部分流量实际线上测试代码。
嗯嗯,就是类似facebook那样的上线方式,也不至于像ctrip那样酿成这样的大事故吧。 听说amazon有个叫apollo的上线系统,几乎可以在线上实现每秒部署一次新代码版本,按照ctrip这玩法,amazon早该被删除几十万次了。 反正我是不懂ctrip这么多的运维和安全都是干嘛去了,线上代码上线前没有充分的自动测试和小流量测试的么?代码发布没有统一的管理出了问题要大家去找发布邮件(微博看到的所谓内部聊天记录,不知道真假),这ctrip的技术部门感觉好像是拿了工资不作为啊!莫名其妙的。 而且全部瘫痪这样的事情应该也是线上系统应该考虑的,就没有应急预案和灾备的么?一个NASDAQ上市的大公司这点技术能力都没有,还要恢复这么久,看着我也是醉了。风平浪静的时候,大家都在游泳,潮水退去了,才发现自己在裸泳,这不是一个所谓大公司的技术部的表现啊。 还好有个elong,好歹也是资本意义上的“灾备”,要不这脸都往那搁啊。 总而言之,ctrip这搞什么鬼,也只有他们自己知道了。留下很多的教训,是很多很多的教训,怎么汲取这个教训,就看各个公司的了。 |
16
phoenixlzx 2015-05-29 20:19:04 +08:00
@RIcter R菊苣日掉了某钩么!
|
17
RIcter 2015-05-29 20:27:32 +08:00
@phoenixlzx 并不是我干的(
|
18
fancy967 2015-05-29 23:08:53 +08:00
亏我还去笔试过携程的安全工程师,虽然也没上...
|
19
matrix67 2015-05-29 23:23:54 +08:00 via Android
openstack啊
|
20
matrix67 2015-05-29 23:24:32 +08:00 via Android 1
游戏界开服和服玩的不亦乐乎。
|
21
df4VW 2015-05-29 23:33:00 +08:00
这时候就知道docker的好了吧,#灾难恢复#
|