一直在用青云的服务。几个月以来没出什么问题。
今天零点多,突然接到报警无法访问, ping 了一下 IP 是通的。
想登录控制台看一下。发现控制台直接无法访问了,也没注意是 404 还是 502
但是换了个用户登录就可以登录控制台,只是放生产环境的那个账户就无法登录,输入用户名密码直接跳到谷歌失败页面。不管输入正确的还是错误的,都直接跳到失败页面。
而我试了一下其他帐号登录,如果密码不对是有错误提示的,密码正确的话也可以登录成功,难道是单个帐号被限制了?
IP 是通的但是 ssh 上不去,一开始怀疑是主机出问题了,但是看了一下监控没有任何问题。因为控制台进不去, ssh 也进不去,没有任何办法,只能等。监控上显示主机和数据库的利用率降得很低。
过了半个小时服务恢复了,进服务器看了一下业务,显示需要连接到数据库的服务的连接在故障期间断掉了,显示数据库不通。但是数据库和主机是在青云建的一个子网。这个断的毫无道理。
问了青云的客服(估计不是技术方面的),他们说因为时间太短(半小时短么),我也没发工单(进不去控制台怎么发工单),他们没法跟踪。。。
我怀疑是青云的内网的交换机出问题了,或者还有其他什么可能?有可能赔偿么(虽然青云的 SLA 一直呵呵呵)。
1
kslr 2015-11-30 11:06:49 +08:00
卧槽,昨晚我也是这样的,半夜收到了通知,停机了两个小时,我还在等通知邮件,现在看来根本不承认!
|
3
wangluowangwang 2015-11-30 11:11:00 +08:00 via Android
服务这么差?还死贵死贵的?!
|
6
tms OP @wangluowangwang 技术还是可以的。就是服务稳定性有待提高。。。
|
7
kslr 2015-11-30 11:20:49 +08:00
|
9
tms OP |
10
tms OP @kslr 。。他们这么搞还不发升级 plan 提醒下就升。出问题也我们没有应急预案,数据库也连不上,切机也不敢切。然后他们控制台啥的都连不上,什么情况都看不了。资源也控制不了。。这只能听天由命么。
|
12
kslr 2015-11-30 11:37:05 +08:00
@tms 这一次升级面也太大了,老是这样搞,技术再好但基本的稳定都保持不了,这么贵还有什么意思?准备撤退了,还没有普通厂家的稳定,虽然技术一般般。
|
15
master 2015-11-30 11:48:08 +08:00 1
少数用户——在他们升级时间正好也没睡的用户(大雾
|
16
SpicyCat 2015-11-30 12:11:03 +08:00
所有的云服务提供商都不会把“赔偿因为云服务故障造成的客户损失”写进合同或者协议里,国内外都这样,比如 AWS 也是这样。但是在故障比较大,影响面比较广的时候,会有云服务商出于挽回商业信誉的考虑,做出赔偿的姿态,但是从法律上来说,即使不赔,你也没法告它。
|
17
kozora 2015-11-30 12:13:34 +08:00
青云控制台经常抽风 (斜眼笑
所以只开亚太来扶墙,业务还是放阿里云去了 |
19
ETiV 2015-11-30 12:37:03 +08:00 via iPhone
青云出过这么多次事故还有人去用,这得多大的勇气……
|
20
zrj766 2015-11-30 12:56:13 +08:00 via Android
贵的不行,还是买阿里、腾讯好了。
|
24
kslr 2015-11-30 17:57:17 +08:00
@tms 我收到了补偿邮件。
你好, 今天零点左右我们对青云亚太 1 区系统进行了升级,由于升级过程出现问题,导致亚太 1 区部分 IP 连接异常,影响了与外网的通讯,影响时间在 0:00 ~ 1:50 左右。因为我们及时发现并做了处理,所以每个 IP 的真正影响时间比总体故障时间要短。 对此我们表示非常抱歉,并全部按照总故障时间为准,给予赔偿。赔偿金额是以亚太 1 区公网 IP 单价为基数,按 2 (小时) * 10 (倍)计算,目前已发放到用户账号。我们会引以为戒,改善测试升级流程,感谢各位对青云的支持。 QingCloud Tech Team |