2019 年初采购的一台带 GPU 的 aliyun 服务器,年费用 3-4 万,当时可能是为了高 io 的性能,数据盘选择了本地磁盘,没选择云磁盘,为这次事故埋下了巨大隐患
昨天 22:11 收到 aliyun 短信报警,磁盘故障,ssh 已无法连接,部分应用还在跑,部分无响应,控制台重启后自动停止,损坏的磁盘挂载目录是 /home,数据众多,出于对大厂的信任,没有太多备份
与工单客服交涉,本地磁盘无备份,损坏了数据丢失无法找回,且在用户协议里写了本地磁盘损坏导致的损失不赔偿
教训:数据无价,定时多重异地备份,不能嫌麻烦,即便是大厂服务器
请教:现在该咋办,工单客服重复表示数据丢失无法找回,请重置示例,是否可以要求提供磁盘自行取出数据?客服确认那是一块单独的物理磁盘,磁盘损坏了
1
xmumiffy 2021-07-03 17:28:10 +08:00 via Android
快照也没开?那就没救了啊
|
2
echo1937 2021-07-03 17:39:58 +08:00 via iPhone
如果没记错的话,虚拟机实例的本地磁盘,一旦重启数据就丢失的,这是多心大才会在本地盘上放数据啊?
出于对大厂的信任就更没道理了,云服务商的磁盘也是地球科技,也会坏掉啊。 |
5
eason1874 2021-07-03 17:54:04 +08:00
本地盘就是物理机,不算云,单点故障是迟早的事,指南都会提示不要单盘存储长期数据,这点是你们大意了,没办法了。
找阿里云看他们能不能帮忙从物理盘恢复数据吧。如果他们不提供这项服务,或者商量能不能直接把硬盘寄给你,你自己找人搞 |
6
yitingbai 2021-07-03 17:58:59 +08:00 15
我要杠一下, 我认为没有备份的数据不算重要数据
|
8
love 2021-07-03 19:30:40 +08:00
本地盘 RAID 都没有的吗?
|
9
yuguorui96 2021-07-03 22:09:26 +08:00
2l 说的没毛病
|
10
fredcc 2021-07-03 22:25:02 +08:00 1
就 1 楼和 4 楼回复的使用习惯,不看官方文档的用法。可能不久以后会再来发一帖又丢数据了
|
11
lhx2008 2021-07-03 22:27:33 +08:00
云硬盘都是三副本,基本没啥问题,本地盘一般都做了 RAID,也还行,本地单盘还是挺危险的
|
12
opengps 2021-07-04 00:13:20 +08:00
这似乎是没办法的结果,本地盘如果要追求极限性能,就不适合多副本。
虽然会有 raid 方案,但是其配置追求极限性能往往采用 raid0 这种顶级的高效率优先方案。 楼主尝试下一个方案:跟阿里云索要这块物理磁盘,看看能否得到支持,如果能拿到物理磁盘,说不定某些高级修复技术可以实现大部分数据的恢复 |
13
wtks1 2021-07-04 01:21:50 +08:00 via Android
还是要靠备份,云硬盘也不靠谱啊,我记得上次哪家公司不就被坑了
|
14
Showfom 2021-07-04 05:31:10 +08:00
巨大隐患?自己不备份怪谁呢,不备份的数据一律都默认是不重要的数据
|
15
villivateur 2021-07-04 09:10:01 +08:00 via Android 1
云服务我觉得知道得有一个 raid1 吧?阿里云没有?
|
16
villivateur 2021-07-04 09:10:14 +08:00 via Android
@villivateur 至少得有
|
17
leafre 2021-07-04 09:28:14 +08:00
警告
使用本地盘存储数据有丢失数据的风险,例如 ECS 实例所在物理机发生硬件故障时。请勿在本地盘上存储需要长期保存的业务数据。 建议您在应用层做数据冗余,保证数据的可用性。您可以使用部署集将业务涉及到的几台 ECS 实例分散部署在不同的物理服务器上,保证业务的高可用性和底层容灾能力。具体操作,请参见创建部署集。 如果您的应用无数据可靠性架构设计,强烈建议您在 ECS 实例中同时使用云盘或者备份服务,提高数据可靠性。更多信息,请参见云盘概述或什么是混合云备份。 |
18
cucldk OP @villivateur 客服答复没有
|
20
salmon5 2021-07-04 13:21:10 +08:00
这个真心不怪阿里云,用户协议已经说的很清楚了;
想保险省事用云盘,3 副本; 想便宜+保险本地盘+主从或者副本集; 想便宜就本地盘裸奔; RAID 就是个不伦不类的东西; |
21
salmon5 2021-07-04 13:22:45 +08:00
RAID 需要依托硬件结合,这个和云的理念是背道而驰的。
云上很简单:云盘 3 副本;本地盘用户自己做冗余;就这么简单。 |
22
salmon5 2021-07-04 14:52:25 +08:00
我再强调下,免得楼主的标题误导别人:是云使用不当,导致数据丢失;并不是云的问题;
|
23
lesismal 2021-07-04 15:21:18 +08:00
即使使用云盘,重要数据也应当自己备份。
并不是云的问题+1 |
24
YaakovZiv 2021-07-04 19:15:53 +08:00
如果是我,我就不取数据了。
1 、硬盘申请来回邮寄需要花钱和走阿里内部的申请流程。坏盘是否可以留在客户手里。 2 、数据恢复是找专业公司还是自己尝试,这里有费用,时间,也有二次损坏的风险。 3 、不知道数据有多大容量。如果超过 1T,早些部署新的业务开始跑服务。减少业务暂停带来的损失。 现在是两部分损失。即将产生的业务需求无法响应的损失。已经发生的硬盘损坏的损失。我会考虑先减小其中一个损失,避免俩损失加一起,被公司内有心人直接把我干走了。 |
25
guo4224 2021-07-05 13:04:27 +08:00
连阿里的硬盘都想要,你是有法院判决还是啥…
|
26
CSGO 2021-07-05 14:19:27 +08:00
能要求寄来吗?我记得有一些专业机构专门就磁盘。
|